Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Парсер сайта «Детские товары оптом»

Задача: 

Выгрузить в Excel данные из выбранного раздела (Одежда, Крупногабаритные товары, Коляски, Игрушки, Текстиль, Аксессуары и косметика, Товары для кормления) сайта dtoshop.ru
Скачать изображения товаров, и сохранить их в папку с именами вида артикул.jpg
В отдельном столбце пометить модификации товара
Свойства товаров вывести в отдельные столбцы

ВложениеРазмерЗагрузкиПоследняя загрузка
Пример результата работы парсера в формате Excel21.1 КБ0Ещё не загружался
Настройки парсера dtoshop.ru26.49 КБ3044 недели 6 дней назад
Описание: 

Стандартный парсер, с перебором сначала всех страниц подкатегорий, потом страниц результатов, потом ссылок на товары.

Большинство характеристик товара со страницу сайта извлекается в отдельном наборе действий GetData
Обычно извлечение данных (артикул, описание, и пр.) идет непосредственно при выводе в столбцы, но в данном парсере по каждому товару выводится несколько строк (для каждой модификации товара), потому, в целях ускорения работы парсера, извлечение нужных данных (с сохранением в переменные) идет один раз для страницы, а при выводе на лист (несколько строк) значения считываются из переменных.

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
   ___    ____   __     __          _____    ____ 
/ _ \ | _ \ \ \ / / __ _ |_ _| / ___|
| (_) | | |_) | \ \ / / / _` | | | | | _
\__, | | __/ \ V / | (_| | | | | |_| |
/_/ |_| \_/ \__,_| |_| \____|
Введите код, изображенный в стиле ASCII-арт.