Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Парсер сайта vamsvet.ru

Задача: 

Собрать данные о товарах с сайта vamsvet.ru (люстры, светильники, лампы, и т.п.), и скачать изображения товаров, разложив их в отдельные папки по брендам

ВложениеРазмерЗагрузкиПоследняя загрузка
Настройки парсера сайта vamsvet.ru (извлечь в папку Настройки парсеров)6.2 КБ0Ещё не загружался
Пример результата в файле Excel (вариант 1)47.08 КБ0Ещё не загружался
Пример результата (вариант 2 - другие столбцы)117.6 КБ0Ещё не загружался
Описание: 

Парсер состоит из 2 частей, — отдельно собирается список товаров на сайте, и потом прогружаются данные по каждому из товаров.

Сначала запускаем парсер 1 - ссылки, который выводит только 1 столбец «Ссылка» (сюда выводятся ссылки на все товары всех разделов)
Этот парсер останавливать нельзя (при повторном запуске он начнёт работу сначала)

После того, как ссылки на все товары выведеные в первый столбец листа, запускаем парсер 2 - данные.
(этот парсер можно останавливать, — при повторном запуске он продолжит работу с места остановки)

Второй парсер добавит в таблицу со ссылками еще 25 столбцов:

  • Вид и подвид товара (например, Люстры / Потолочные)
  • Артикул
  • Страна
  • Места применения
  • Торговая марка (бренд)
  • Коллекция
  • Стили
  • Цвет и материал арматуры
  • Цвет и материал плафона
  • Площадь освещения
  • Степени защиты
  • Лампы (количество и мощность, например, 5*40W E27 220V)
  • Размеры (высота, диаметр, ширина)
  • Напряжение питания
  • Тип монтажа
  • Описание
  • Цена
  • Наличие
  • Тип цоколя и тип лампы

При покупке этого парсера, вторую часть парсера (отвечающую за вывод данных по ссылкам) вы получаете в 2 вариантах (некоторые столбцы отличаются, и первый вариант скачивает фото товара, в то время как второй вариант выводит ссылки на фото в таблицу Excel)

Парсинг этого сайта осложняется тем, что на сайте присутствуют страницы (карточки товаров) двух видов, — немного отличающиеся с виду, и сильно отличающиеся по начинке. Потому, для этого сайта настройка очень непростая, сочетающая в себе обработку разных типов страниц.

Ограничения пробной версии: обрабатываются только первые 3 страницы результатов (3*35=105 товаров) из каждого раздела сайта

Стоимость этого парсера без перенастройки («как есть»): 1800 рублей
Стоимость этого парсера c перенастройкой (под ваши нужды): от 2400 рублей
(плюс стоимость программы-парсера 2500 рублей, если вы ранее не покупали надстройку «Parser»)

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
 __     __ __        __     _      _    __   __ __        __
\ \ / / \ \ / / / \ | |_ \ \ / / \ \ / /
\ \ / / \ \ /\ / / / _ \ | __| \ V / \ \ /\ / /
\ V / \ V V / / ___ \ | |_ | | \ V V /
\_/ \_/\_/ /_/ \_\ \__| |_| \_/\_/
Введите код, изображенный в стиле ASCII-арт.