Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Обработка подуровней разной вложенности на примере парсинга сайта cefalon.by - оптовая продажа женской одежды и аксессуаров

Задача: 

Вывести информацию о товарах с сайта - название, размеры, цену, описание, вывести информацию о разделах, в которых находится товар с учетом того, что вложенность разделов может быть разной (см. скриншот).

ВложениеРазмерЗагрузкиПоследняя загрузка
Настройки парсера для сбора информации с сайта cefalon.by12.15 КБ2281 день 11 часов назад
Образец выгрузки парсером данных с сайта cefalon.by в формате Эксель22.65 КБ0Ещё не загружался
Описание: 

Тестовая настройка выводит по три товара из первых нескольких разделов сайта. Небольшое количество товаров сделано для того, чтобы показать как настройка выводит разные подразделы (второго и третьего уровня вложенности).

Принцип настройки данного парсера в том, чтобы в случае отсутствия нижележащего подуровня передавать в следующее действие то же самое значение. Это сделано при помощи действий "Создать список значений" и "Добавить значение в список значений".

При это в переменные подразделов прописываются одинаковые данные, чтобы их убрать на этапе вывода на лист, идет сравнение по маске. И если переменная нижележащего подуровня содержит такое же значение, как и родительская категория, то такое значение удаляется.

В остальном настройка достаточно стандартна. Для просмотра цены необходима авторизация на сайте. После авторизации при помощи парсера возможно переключение валют с белорусских на российские рубли.

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
          _                   _       _____ 
__ _ (_) __ __ __ _ | | |___ /
/ _` | | | \ \ / / / _` | | | |_ \
| (_| | | | \ V / | (_| | | |___ ___) |
\__,_| |_| \_/ \__, | |_____| |____/
|___/
Введите код, изображенный в стиле ASCII-арт.