Собрать данные о товарах с сайта vamsvet.ru (люстры, светильники, лампы, и т.п.), и скачать изображения товаров, разложив их в отдельные папки по брендам
Парсер состоит из 2 частей, — отдельно собирается список товаров на сайте, и потом прогружаются данные по каждому из товаров.
Сначала запускаем парсер 1 - ссылки, который выводит только 1 столбец «Ссылка» (сюда выводятся ссылки на все товары всех разделов)
Этот парсер останавливать нельзя (при повторном запуске он начнёт работу сначала)
После того, как ссылки на все товары выведеные в первый столбец листа, запускаем парсер 2 - данные.
(этот парсер можно останавливать, — при повторном запуске он продолжит работу с места остановки)
Второй парсер добавит в таблицу со ссылками еще 25 столбцов:
- Вид и подвид товара (например, Люстры / Потолочные)
- Артикул
- Страна
- Места применения
- Торговая марка (бренд)
- Коллекция
- Стили
- Цвет и материал арматуры
- Цвет и материал плафона
- Площадь освещения
- Степени защиты
- Лампы (количество и мощность, например, 5*40W E27 220V)
- Размеры (высота, диаметр, ширина)
- Напряжение питания
- Тип монтажа
- Описание
- Цена
- Наличие
- Тип цоколя и тип лампы
При покупке этого парсера, вторую часть парсера (отвечающую за вывод данных по ссылкам) вы получаете в 2 вариантах (некоторые столбцы отличаются, и первый вариант скачивает фото товара, в то время как второй вариант выводит ссылки на фото в таблицу Excel)
Парсинг этого сайта осложняется тем, что на сайте присутствуют страницы (карточки товаров) двух видов, — немного отличающиеся с виду, и сильно отличающиеся по начинке. Потому, для этого сайта настройка очень непростая, сочетающая в себе обработку разных типов страниц.
Комментарии
Отправить комментарий