Парсер файла html

Задача: 

Загрузить данные из выбранного текстового файла (на примере файла html), и вывести результат в таблицу Excel.

Описание: 

Это пример простейшего парсера, который позволяет загрузить данные из файла текстового формата (в данном случае используется html, который относится к текстовым файлам)

Механизм настройки такого парсера очень прост:

  1. создаём новый парсер, включаем вывод на лист, и в настройках листа для вывода ставим галочки для создания новой таблицу Excel и для вывода заголовков
  2. в исходных данных парсера прописываем 3 команды:
    • вывод диалогового окна для выбора обрабатываемого файла
    • загрузка содержимого текстового файла (важно не ошибиться с кодировкой, utf-8 или windows-1251)
    • обработка содержимого (извлечение данных из текста), — в данном примере это действие для поиска тегов
  3. настраиваем вывод в столбцы (действия для обработки текста, и/или поиск тегов)

 

В данном примере также продемонстрирована возможность парсера вставлять изображения вместо вывода ссылки на картинку.

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
      _       _           ____   __        __  _____ 
| | | | __ _ | _ \ \ \ / / |_ _|
_ | | _ | | / _` | | | | | \ \ /\ / / | |
| |_| | | |_| | | (_| | | |_| | \ V V / | |
\___/ \___/ \__,_| |____/ \_/\_/ |_|
Введите код, изображенный в стиле ASCII-арт.