- Как заказать парсер сайта
- Видеоинструкции по настройке
- Возможности программы-парсера
- Действия в парсере
- Раздел «Работа с HTML»
- Раздел «Текстовые»
- Раздел «Перекодировка и форматирование»
- Раздел «Проверка и сравнение»
- Раздел «Разное»
- Раздел «Функции массива»
- Раздел «Числовые»
- Раздел «Работа с переменными»
- Раздел «Листы и книги Excel»
- Раздел «Обработка файлов из папки»
- Раздел «HTTP запрос»
- Раздел «Internet Explorer»
- Раздел «Управление парсером»
- Раздел «Веб-запросы, XML, макросы VBA»
- Недокументированные действия
- Работа с браузером (Chrome и т.п.)
- Отключенные (устаревшие) действия
- Интерфейс программы
- Использование браузера
- Ошибки при парсинге
- Вывод массива значений в одну ячейку
- Обход защиты Qrator, Incapsula и CloudFare
- Ошибка: сервер не ответил за 9 секунд
- Парсер перезаписывает данные в первой строке листа
- Невозможно запустить макрос, - нет доступа к проекту VBA
- Ошибка Compile error in hidden module
- Ошибка загрузки страницы по HTTPS (SSL Error)
- Дополнительные возможности
- Зарезервированные переменные и подстановочные коды парсера
- Кеширование страниц в парсере
- Переменные в парсере
- Обновление строк в существующей таблице при парсинге
- Переключение между наборами настроек в парсере
- Запуск мониторинга цен по расписанию
- Запуск парсера по расписанию
- Программный запуск парсера из внешнего макроса
- Доп. опции парсера (файл parser.ini)
- Наборы действий
- Прочие статьи по настройке парсера
- Коды останова парсера, и перехода на другое действие
- Плагины для парсера
- Запуск нескольких парсеров по очереди
- Обработка капчи (Captcha) в парсере
- Прокси серверы
Действие парсера «HTML: Удаление тегов / комментов» |
|||||||||||||||
Параметры действия:Предназначение действия:Действие "HTML: Удаление тегов / комментов" предназначено для удаления тегов и комментариев в HTML-коде. Есть возможность задать сразу несколько тегов для удаления, разделяя их вертикальной чертой (в формате script|iframe|strong), а также удалить HTML комментарии вида <!--текст комментария-->, задав в качестве параметра действия слово comments. Действие полезно, если в исходной странице не срабатывает поиск тегов по имени класса. В принципе, теги можно удалять при помощи действия HTML: Поиск тегов, но им нельзя удалить комментарии HTML-кода. Особенностью работы действия HTML: Поиск тегов является то, что оно ищет теги даже внутри комментариев, это может привести к тому, что будут найдены "лишние" теги, которые на странице не отображаются. Удаление скриптов из кода страницы (тег <script></script>) зачастую облегчает настройку парсера. При нажатии на кнопку "Открыть в браузере" в окне редактора действий HTML-код открывается в браузере по умолчанию, и если в HTML-коде содержатся скрипты, то они начинают выполняться, иногда загораживая текст ненужными всплывающими окнами или же вообще включая переадресацию на другую страницу. Удаление скриптов позволяет решить эту проблему. Вместе с тем постоянное удаление скриптов (такая опция может быть включена в настройках конкретного парсера) может привести к тому, что часть полезной информации будет потеряна, т.к. на некоторых сайтах информация хранится в скриптах, например в формате JSON. Параметр «Удаляемые теги (например, script|iframe)»Примеры использования:
|
Комментарии
Здравствуйте.
Вот так попробуйте:
Здравстуйте, встретился с такой проблемой нужно оставить текст комментария УНббА Когда проставляю теги для получения артикула выводится "Н/Д", хотя нужно "УН66А". Как я понимаю "УН66А" это комментарий, а в парсере есть только удаление комментариев. Так же в коде страницы через поисковик не находит текст "УН66А", поэтому парсер не видит, хотя на сайте я вижу https://trugor.ru/products/unitaz-napolnyj-bez-baka/
Что делать в этой ситуации, или же есть все таки определенная функция для этой ситуации?
P.S. Отдельное спасибо вам за эту программму, еле добился покупки через работодателя, теперь никак не нарадуюсь))