Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Обработка подуровней разной вложенности на примере парсинга сайта cefalon.by - оптовая продажа женской одежды и аксессуаров

Задача: 

Вывести информацию о товарах с сайта - название, размеры, цену, описание, вывести информацию о разделах, в которых находится товар с учетом того, что вложенность разделов может быть разной (см. скриншот).

ВложениеРазмерЗагрузкиПоследняя загрузка
Настройки парсера для сбора информации с сайта cefalon.by12.15 КБ2292 недели 4 дня назад
Образец выгрузки парсером данных с сайта cefalon.by в формате Эксель22.65 КБ0Ещё не загружался
Описание: 

Тестовая настройка выводит по три товара из первых нескольких разделов сайта. Небольшое количество товаров сделано для того, чтобы показать как настройка выводит разные подразделы (второго и третьего уровня вложенности).

Принцип настройки данного парсера в том, чтобы в случае отсутствия нижележащего подуровня передавать в следующее действие то же самое значение. Это сделано при помощи действий "Создать список значений" и "Добавить значение в список значений".

При это в переменные подразделов прописываются одинаковые данные, чтобы их убрать на этапе вывода на лист, идет сравнение по маске. И если переменная нижележащего подуровня содержит такое же значение, как и родительская категория, то такое значение удаляется.

В остальном настройка достаточно стандартна. Для просмотра цены необходима авторизация на сайте. После авторизации при помощи парсера возможно переключение валют с белорусских на российские рубли.

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
     _               ___    _  _     _       ____  
/ \ _ __ / _ \ | || | | |__ |___ \
/ _ \ | '_ \ | | | | | || |_ | '_ \ __) |
/ ___ \ | | | | | |_| | |__ _| | | | | / __/
/_/ \_\ |_| |_| \__\_\ |_| |_| |_| |_____|
Введите код, изображенный в стиле ASCII-арт.