Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Обработка подуровней разной вложенности на примере парсинга сайта cefalon.by - оптовая продажа женской одежды и аксессуаров

Задача: 

Вывести информацию о товарах с сайта - название, размеры, цену, описание, вывести информацию о разделах, в которых находится товар с учетом того, что вложенность разделов может быть разной (см. скриншот).

ВложениеРазмерЗагрузкиПоследняя загрузка
Настройки парсера для сбора информации с сайта cefalon.by12.15 КБ2361 неделя 1 день назад
Образец выгрузки парсером данных с сайта cefalon.by в формате Эксель22.65 КБ0Ещё не загружался
Описание: 

Тестовая настройка выводит по три товара из первых нескольких разделов сайта. Небольшое количество товаров сделано для того, чтобы показать как настройка выводит разные подразделы (второго и третьего уровня вложенности).

Принцип настройки данного парсера в том, чтобы в случае отсутствия нижележащего подуровня передавать в следующее действие то же самое значение. Это сделано при помощи действий "Создать список значений" и "Добавить значение в список значений".

При это в переменные подразделов прописываются одинаковые данные, чтобы их убрать на этапе вывода на лист, идет сравнение по маске. И если переменная нижележащего подуровня содержит такое же значение, как и родительская категория, то такое значение удаляется.

В остальном настройка достаточно стандартна. Для просмотра цены необходима авторизация на сайте. После авторизации при помощи парсера возможно переключение валют с белорусских на российские рубли.

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
  _   _   _  _      ____  __        __            
/ | | | | || | / ___| \ \ / / _ __ ___
| | | | | || |_ | | _ \ \ /\ / / | '_ ` _ \
| | | | |__ _| | |_| | \ V V / | | | | | |
|_| |_| |_| \____| \_/\_/ |_| |_| |_|
Введите код, изображенный в стиле ASCII-арт.