Действие парсера «HTML: Получить список категорий»

Действие предназначено для быстрого извлечения списка категорий из строки навигации (Breadcrumbs).

Можно отбросить несколько первых значений (например, «Главная» или «Каталог»), или несколько последних (если последним пунктом идёт название товара).

Действие имеет 3 параметра:

 

Действие является комбинацией следующих действий:
1. Найти первый тег класса (breadcrumb);
2. Найти в нём все теги (a), взяв текст из этих тегов;
3. Удалить лишние элементы массива;

Возвращаемое значение: массив из нескольких текстовых значений.

Параметр «HTML фильтры (например, class=navigation)»

Тип параметра: выбор из списка, или ввод вручную

Примеры значений параметра: ; id=breadcrumbs; id=nav

В данном параметре можно указать парсеру, внутри какого тега надо искать ссылки. Зачастую это помогает получить нужный результат. Синтаксис допускает следующие способы указания нужного тега:

  • с указанием тега, атрибута и его значения, например: ul class=pager
  • с указанием только атрибута и его значения, например: id=pager

Если фильтр задан неправильно, то появится сообщение:

Применён HTML фильтр
(длина HTML после фильтрации: 0)
Не найдены ссылки (тег A) в отфильтрованном HTML - проверьте HTML фильтр.

 

Параметр «Начать с элемента с номером»

Тип параметра: выбор из списка, или ввод вручную

Примеры значений параметра: 1; 2; 3; 4

Значение по умолчанию: 1

Указывает, с номера какой категории нужно формировать массив ссылок.

 

Параметр «Удалить последние в количестве»

Тип параметра: выбор из списка, или ввод вручную

Примеры значений параметра: 1; 2

Указывает, какое количество последних категорий нужно отбросить при формировании массива ссылок.

 

Примеры использования:

Имеется страница товара с категориями Главная -> Бизнес-литература -> Саморазвитие. Мотивация.

Действие Параметр Значение Результат
HTML: Получить список категорий HTML фильтры Массив из 2 значений:

Начать с элемента с номером 2
Удалить последние в количестве
Действие Параметр Значение Результат
HTML: Получить список категорий HTML фильтры Массив из 2 значений:

Начать с элемента с номером
Удалить последние в количестве 1