Парсер файла html

Задача: 

Загрузить данные из выбранного текстового файла (на примере файла html), и вывести результат в таблицу Excel.

Описание: 

Это пример простейшего парсера, который позволяет загрузить данные из файла текстового формата (в данном случае используется html, который относится к текстовым файлам)

Механизм настройки такого парсера очень прост:

  1. создаём новый парсер, включаем вывод на лист, и в настройках листа для вывода ставим галочки для создания новой таблицу Excel и для вывода заголовков
  2. в исходных данных парсера прописываем 3 команды:
    • вывод диалогового окна для выбора обрабатываемого файла
    • загрузка содержимого текстового файла (важно не ошибиться с кодировкой, utf-8 или windows-1251)
    • обработка содержимого (извлечение данных из текста), — в данном примере это действие для поиска тегов
  3. настраиваем вывод в столбцы (действия для обработки текста, и/или поиск тегов)

 

В данном примере также продемонстрирована возможность парсера вставлять изображения вместо вывода ссылки на картинку.

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
      _   _____   _       ___   _____  ____  
| | |_ _| | |__ |_ _| |__ / | ___|
_ | | | | | '_ \ | | / / |___ \
| |_| | | | | |_) | | | / /_ ___) |
\___/ |_| |_.__/ |___| /____| |____/
Введите код, изображенный в стиле ASCII-арт.