Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Парсер сайта «Детские товары оптом»

Задача: 

Выгрузить в Excel данные из выбранного раздела (Одежда, Крупногабаритные товары, Коляски, Игрушки, Текстиль, Аксессуары и косметика, Товары для кормления) сайта dtoshop.ru
Скачать изображения товаров, и сохранить их в папку с именами вида артикул.jpg
В отдельном столбце пометить модификации товара
Свойства товаров вывести в отдельные столбцы

ВложениеРазмерЗагрузкиПоследняя загрузка
Пример результата работы парсера в формате Excel21.1 КБ0Ещё не загружался
Настройки парсера dtoshop.ru26.49 КБ3043 дня 13 часов назад
Описание: 

Стандартный парсер, с перебором сначала всех страниц подкатегорий, потом страниц результатов, потом ссылок на товары.

Большинство характеристик товара со страницу сайта извлекается в отдельном наборе действий GetData
Обычно извлечение данных (артикул, описание, и пр.) идет непосредственно при выводе в столбцы, но в данном парсере по каждому товару выводится несколько строк (для каждой модификации товара), потому, в целях ускорения работы парсера, извлечение нужных данных (с сохранением в переменные) идет один раз для страницы, а при выводе на лист (несколько строк) значения считываются из переменных.

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
     _          _   _       _      _____    ____ 
/ \ | | | |__ | | __ |___ / / ___|
/ _ \ _ | | | '_ \ | |/ / |_ \ | |
/ ___ \ | |_| | | | | | | < ___) | | |___
/_/ \_\ \___/ |_| |_| |_|\_\ |____/ \____|
Введите код, изображенный в стиле ASCII-арт.