Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Пример сложной настройки парсера - сайт velograd.ru. Анализ сочетаний размеров и цветов товара на одной странице.

Задача: 

Не просто скачать весь ассортимент сайта, но также разбить велотовары, у которых несколько вариантов цветов и размеров на несколько строк. Для каждого варианта написать свою цену и наличие товара (т.к. у разных цветов и размеров цена может отличаться).

ВложениеРазмерЗагрузкиПоследняя загрузка
Образец выгрузки данных с сайта velograd в формате Эксель21.56 КБ0Ещё не загружался
Настройки парсера для сбора информации с сайта velograd.ru19.68 КБ1806 недель 2 часа назад
Описание: 

Сайт velograd.ru является довольно сложным для парсинга с точки зрения того, что у одного велосипеда могут быть разные сочетания цветов и размеров, и в свою очередь у каждого сочетания может быть своя цена (см. 2-ой скриншот). Также какие-то сочетания есть в наличии, а каких-то нет.

Парсер анализирует страницу и при помощи сохранения и сравнения индексов цветов и размеров в переменные извлекает нужные данные.

На лист выводятся бренд, название, артикул товара. Разделы сайта, в которые попадает данный товар, размер рамы, цвет, код товара, розничная цена, наличие. Ссылки на фото и видео материалы, также выводится таблица характеристик (каждая характеристика помещается в свой столбец).

Тестовая настройка, выложенная в статье, скачивает первые 20 товаров с сайта. Полная настройка скачивает весь ассортимент.

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
  ____    ___         _____        ____  
| _ \ |_ _| ___ |__ / ____ / ___|
| |_) | | | / __| / / |_ / \___ \
| _ < | | \__ \ / /_ / / ___) |
|_| \_\ |___| |___/ /____| /___| |____/
Введите код, изображенный в стиле ASCII-арт.