Действие парсера «HTML: Удаление тегов / комментов»

Параметры действия:

Предназначение действия:

Действие "HTML: Удаление тегов / комментов" предназначено для удаления тегов и комментариев в HTML-коде.
В параметре Удаляемые теги указываются теги, которые нужно удалить (например, script или iframe).

Есть возможность задать сразу несколько тегов для удаления, разделяя их вертикальной чертой (в формате script|iframe|strong), а также удалить HTML комментарии вида <!--текст комментария-->, задав в качестве параметра действия слово comments.

Действие полезно, если в исходной странице не срабатывает поиск тегов по имени класса.
Действие работает без использования HTML-движка Windows (обычный поиск в тексте, и удаление найденного).

В принципе, теги можно удалять при помощи действия HTML: Поиск тегов, но им нельзя удалить комментарии HTML-кода. Особенностью работы действия HTML: Поиск тегов является то, что оно ищет теги даже внутри комментариев, это может привести к тому, что будут найдены "лишние" теги, которые на странице не отображаются.

Удаление скриптов из кода страницы (тег <script></script>) зачастую облегчает настройку парсера. При нажатии на кнопку "Открыть в браузере" в окне редактора действий HTML-код открывается в браузере по умолчанию, и если в HTML-коде содержатся скрипты, то они начинают выполняться, иногда загораживая текст ненужными всплывающими окнами или же вообще включая переадресацию на другую страницу. Удаление скриптов позволяет решить эту проблему. Вместе с тем постоянное удаление скриптов (такая опция может быть включена в настройках конкретного парсера) может привести к тому, что часть полезной информации будет потеряна, т.к. на некоторых сайтах информация хранится в скриптах, например в формате JSON.

Параметр «Удаляемые теги (например, script|iframe)»

Тип параметра: выбор из списка, или ввод вручную

Примеры значений параметра: script; script|iframe; comments

Значение по умолчанию: script|iframe

Примеры использования:

Действие Параметр Значение
HTML: Удаление тегов / комментов Удаляемые теги script|comments
Исходное значение Результат
<h1>Заголовок</h1>
<script>Текст скрипта</script>
<!-- Комментарий HTML

продолжается комментарий

<div>Какие-то ненужные теги</div>

-->
<div>Нужный текст</div>
<h1>Заголовок</h1>


<div>Нужный текст</div>

Комментарии

Здравствуйте.
Вот так попробуйте:

Действие Параметр Значение
Загрузить ИСХОДНЫЙ КОД веб-страницы URL
HTML: Поиск тегов Тип элемента form
Название проверяемого атрибута class
Значение проверяемого атрибута variations_form
Тип результата / извлекаемый атрибут data-product_variations 1
Сохранить результат в переменную
Использовать новое значение да
Декодирование JSON
Быстрый поиск значения в JSON Список ключей для поиска, через / sku
Сохранить результат в переменную
Использовать новое значение да
Исходное значение Результат
https://trugor.ru/products/unitaz-napolnyj-bez-baka/
УНббА

 

Здравстуйте, встретился с такой проблемой нужно оставить текст комментария УНббА Когда проставляю теги для получения артикула выводится "Н/Д", хотя нужно "УН66А". Как я понимаю "УН66А" это комментарий, а в парсере есть только удаление комментариев. Так же в коде страницы через поисковик не находит текст "УН66А", поэтому парсер не видит, хотя на сайте я вижу https://trugor.ru/products/unitaz-napolnyj-bez-baka/
Что делать в этой ситуации, или же есть все таки определенная функция для этой ситуации?
P.S. Отдельное спасибо вам за эту программму, еле добился покупки через работодателя, теперь никак не нарадуюсь))