Парсер файла html

Задача: 

Загрузить данные из выбранного текстового файла (на примере файла html), и вывести результат в таблицу Excel.

Описание: 

Это пример простейшего парсера, который позволяет загрузить данные из файла текстового формата (в данном случае используется html, который относится к текстовым файлам)

Механизм настройки такого парсера очень прост:

  1. создаём новый парсер, включаем вывод на лист, и в настройках листа для вывода ставим галочки для создания новой таблицу Excel и для вывода заголовков
  2. в исходных данных парсера прописываем 3 команды:
    • вывод диалогового окна для выбора обрабатываемого файла
    • загрузка содержимого текстового файла (важно не ошибиться с кодировкой, utf-8 или windows-1251)
    • обработка содержимого (извлечение данных из текста), — в данном примере это действие для поиска тегов
  3. настраиваем вывод в столбцы (действия для обработки текста, и/или поиск тегов)

 

В данном примере также продемонстрирована возможность парсера вставлять изображения вместо вывода ссылки на картинку.

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
   ___    _____               _   _   _____         
/ _ \ |___ | _ __ ___ | | | | | ___| __ _
| (_) | / / | '_ ` _ \ | |_| | | |_ / _` |
\__, | / / | | | | | | | _ | | _| | (_| |
/_/ /_/ |_| |_| |_| |_| |_| |_| \__, |
|___/
Введите код, изображенный в стиле ASCII-арт.