Действие парсера «Настройки распознавания подуровней»

Параметры действия:

Предназначение действия:

Настройки распознавания подуровней, при иерархической структуре веб-документа
НЕ ЯВЛЯЕТСЯ ДЕЙСТВИЕМ! Включается в состав «набора правил», который используется действием «Обработка иерархических документов»

В наборе действий должно быть как минимум 2 правила (для уровней 1 и 2)

Возвращаемое значение: отсутствует (текущее значение не изменяется)

 


Параметр «Уровень»

Тип параметра: числовое значение (целое число) от 1 до 9

Значение по умолчанию: 1

 

Параметр «Название подуровня»

Тип параметра: произвольное текстовое значение

 

Параметр «Маска для проверки элемента HTML»

Тип параметра: произвольное текстовое значение

Например, для поиска тегов <li> можно задать маску вида <li*>*</li>

 

Параметр «Элемент полностью, или только содержимое»

Тип параметра: выбор из списка предопределенных значений

Допустимые значения параметра: outerHTML; innerHTML

Значение по умолчанию: outerHTML

 

 

Примеры использования:

 

Создадим в парсере набор действий с названием levels, и добавим в него 2 действия:

 

Действие Параметр Значение
Настройки распознавания подуровней Уровень 1
Название подуровня group
Маска для проверки элемента HTML <li*>*</li>
InnerHTML или OuterHTML innerHTML
Настройки распознавания подуровней Уровень 2
Название подуровня content
Маска для проверки элемента HTML <label*>*</label>
InnerHTML или OuterHTML innerHTML

 

После этого, в любом списке действий парсера, можно применить эти правила для преобразования HTML кода в массив значений, используя действие Обработка иерархических документов