Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Парсер сайта «Детские товары оптом»

Задача: 

Выгрузить в Excel данные из выбранного раздела (Одежда, Крупногабаритные товары, Коляски, Игрушки, Текстиль, Аксессуары и косметика, Товары для кормления) сайта dtoshop.ru
Скачать изображения товаров, и сохранить их в папку с именами вида артикул.jpg
В отдельном столбце пометить модификации товара
Свойства товаров вывести в отдельные столбцы

ВложениеРазмерЗагрузкиПоследняя загрузка
Пример результата работы парсера в формате Excel21.1 КБ0Ещё не загружался
Настройки парсера dtoshop.ru26.49 КБ3242 недели 6 дней назад
Описание: 

Стандартный парсер, с перебором сначала всех страниц подкатегорий, потом страниц результатов, потом ссылок на товары.

Большинство характеристик товара со страницу сайта извлекается в отдельном наборе действий GetData
Обычно извлечение данных (артикул, описание, и пр.) идет непосредственно при выводе в столбцы, но в данном парсере по каждому товару выводится несколько строк (для каждой модификации товара), потому, в целях ускорения работы парсера, извлечение нужных данных (с сохранением в переменные) идет один раз для страницы, а при выводе на лист (несколько строк) значения считываются из переменных.

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
  ____    _____     _   _      ____   __     __
| ___| |___ / (_) | | __ | _ \ \ \ / /
|___ \ |_ \ | | | |/ / | |_) | \ \ / /
___) | ___) | | | | < | _ < \ V /
|____/ |____/ _/ | |_|\_\ |_| \_\ \_/
|__/
Введите код, изображенный в стиле ASCII-арт.