Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Парсер сайта «Детские товары оптом»

Задача: 

Выгрузить в Excel данные из выбранного раздела (Одежда, Крупногабаритные товары, Коляски, Игрушки, Текстиль, Аксессуары и косметика, Товары для кормления) сайта dtoshop.ru
Скачать изображения товаров, и сохранить их в папку с именами вида артикул.jpg
В отдельном столбце пометить модификации товара
Свойства товаров вывести в отдельные столбцы

ВложениеРазмерЗагрузкиПоследняя загрузка
Пример результата работы парсера в формате Excel21.1 КБ0Ещё не загружался
Настройки парсера dtoshop.ru26.49 КБ3322 недели 1 день назад
Описание: 

Стандартный парсер, с перебором сначала всех страниц подкатегорий, потом страниц результатов, потом ссылок на товары.

Большинство характеристик товара со страницу сайта извлекается в отдельном наборе действий GetData
Обычно извлечение данных (артикул, описание, и пр.) идет непосредственно при выводе в столбцы, но в данном парсере по каждому товару выводится несколько строк (для каждой модификации товара), потому, в целях ускорения работы парсера, извлечение нужных данных (с сохранением в переменные) идет один раз для страницы, а при выводе на лист (несколько строк) значения считываются из переменных.

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
  _   _  __   __ __   __  _        ____   ____  
| \ | | \ \ / / \ \ / / | |__ / ___| | _ \
| \| | \ V / \ V / | '_ \ | | _ | |_) |
| |\ | | | | | | |_) | | |_| | | _ <
|_| \_| |_| |_| |_.__/ \____| |_| \_\
Введите код, изображенный в стиле ASCII-арт.