Парсер файла html

Задача: 

Загрузить данные из выбранного текстового файла (на примере файла html), и вывести результат в таблицу Excel.

Описание: 

Это пример простейшего парсера, который позволяет загрузить данные из файла текстового формата (в данном случае используется html, который относится к текстовым файлам)

Механизм настройки такого парсера очень прост:

  1. создаём новый парсер, включаем вывод на лист, и в настройках листа для вывода ставим галочки для создания новой таблицу Excel и для вывода заголовков
  2. в исходных данных парсера прописываем 3 команды:
    • вывод диалогового окна для выбора обрабатываемого файла
    • загрузка содержимого текстового файла (важно не ошибиться с кодировкой, utf-8 или windows-1251)
    • обработка содержимого (извлечение данных из текста), — в данном примере это действие для поиска тегов
  3. настраиваем вывод в столбцы (действия для обработки текста, и/или поиск тегов)

 

В данном примере также продемонстрирована возможность парсера вставлять изображения вместо вывода ссылки на картинку.

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
 __  __                ___   _____  _     
\ \/ / ___ ___ |_ _| |__ / | |__
\ / / _ \ / _ \ | | / / | '_ \
/ \ | __/ | __/ | | / /_ | | | |
/_/\_\ \___| \___| |___| /____| |_| |_|
Введите код, изображенный в стиле ASCII-арт.