Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Пример сложной настройки парсера - сайт velograd.ru. Анализ сочетаний размеров и цветов товара на одной странице.

Задача: 

Не просто скачать весь ассортимент сайта, но также разбить велотовары, у которых несколько вариантов цветов и размеров на несколько строк. Для каждого варианта написать свою цену и наличие товара (т.к. у разных цветов и размеров цена может отличаться).

ВложениеРазмерЗагрузкиПоследняя загрузка
Образец выгрузки данных с сайта velograd в формате Эксель21.56 КБ0Ещё не загружался
Настройки парсера для сбора информации с сайта velograd.ru19.68 КБ1834 дня 10 часов назад
Описание: 

Сайт velograd.ru является довольно сложным для парсинга с точки зрения того, что у одного велосипеда могут быть разные сочетания цветов и размеров, и в свою очередь у каждого сочетания может быть своя цена (см. 2-ой скриншот). Также какие-то сочетания есть в наличии, а каких-то нет.

Парсер анализирует страницу и при помощи сохранения и сравнения индексов цветов и размеров в переменные извлекает нужные данные.

На лист выводятся бренд, название, артикул товара. Разделы сайта, в которые попадает данный товар, размер рамы, цвет, код товара, розничная цена, наличие. Ссылки на фото и видео материалы, также выводится таблица характеристик (каждая характеристика помещается в свой столбец).

Тестовая настройка, выложенная в статье, скачивает первые 20 товаров с сайта. Полная настройка скачивает весь ассортимент.

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
      _    ____   _  _             _   _     
| | / ___| | || | _ __ / | | |
_ | | | | _ | || |_ | '_ \ | | | |
| |_| | | |_| | |__ _| | | | | | | | |___
\___/ \____| |_| |_| |_| |_| |_____|
Введите код, изображенный в стиле ASCII-арт.