Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Парсер сайта «Детские товары оптом»

Задача: 

Выгрузить в Excel данные из выбранного раздела (Одежда, Крупногабаритные товары, Коляски, Игрушки, Текстиль, Аксессуары и косметика, Товары для кормления) сайта dtoshop.ru
Скачать изображения товаров, и сохранить их в папку с именами вида артикул.jpg
В отдельном столбце пометить модификации товара
Свойства товаров вывести в отдельные столбцы

ВложениеРазмерЗагрузкиПоследняя загрузка
Пример результата работы парсера в формате Excel21.1 КБ0Ещё не загружался
Настройки парсера dtoshop.ru26.49 КБ3141 неделя 4 дня назад
Описание: 

Стандартный парсер, с перебором сначала всех страниц подкатегорий, потом страниц результатов, потом ссылок на товары.

Большинство характеристик товара со страницу сайта извлекается в отдельном наборе действий GetData
Обычно извлечение данных (артикул, описание, и пр.) идет непосредственно при выводе в столбцы, но в данном парсере по каждому товару выводится несколько строк (для каждой модификации товара), потому, в целях ускорения работы парсера, извлечение нужных данных (с сохранением в переменные) идет один раз для страницы, а при выводе на лист (несколько строк) значения считываются из переменных.

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
 __   __   ____  __   __      _            __ 
\ \ / / / ___| \ \ / / | | _ _ / _|
\ V / | | _ \ V / _ | | | | | | | |_
| | | |_| | | | | |_| | | |_| | | _|
|_| \____| |_| \___/ \__,_| |_|
Введите код, изображенный в стиле ASCII-арт.