Парсер файла html

Задача: 

Загрузить данные из выбранного текстового файла (на примере файла html), и вывести результат в таблицу Excel.

Описание: 

Это пример простейшего парсера, который позволяет загрузить данные из файла текстового формата (в данном случае используется html, который относится к текстовым файлам)

Механизм настройки такого парсера очень прост:

  1. создаём новый парсер, включаем вывод на лист, и в настройках листа для вывода ставим галочки для создания новой таблицу Excel и для вывода заголовков
  2. в исходных данных парсера прописываем 3 команды:
    • вывод диалогового окна для выбора обрабатываемого файла
    • загрузка содержимого текстового файла (важно не ошибиться с кодировкой, utf-8 или windows-1251)
    • обработка содержимого (извлечение данных из текста), — в данном примере это действие для поиска тегов
  3. настраиваем вывод в столбцы (действия для обработки текста, и/или поиск тегов)

 

В данном примере также продемонстрирована возможность парсера вставлять изображения вместо вывода ссылки на картинку.

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
  _   _     _   ____            __  __         
| | | | (_) | _ \ _ _ | \/ | _ __
| |_| | | | | |_) | | | | | | |\/| | | '_ \
| _ | | | | __/ | |_| | | | | | | |_) |
|_| |_| _/ | |_| \__,_| |_| |_| | .__/
|__/ |_|
Введите код, изображенный в стиле ASCII-арт.