Перебрать все файлы в заданной папке, и сформировать таблицу Excel с данными из этих файлов.
Этот парсер демонстрирует возможности парсера по извлечению данных из файлов.
Для примера взяты файлы пропусков формата Word, сформированные надстройкой FillDocuments, но для файлов другого типа (текстовых, Excel, html / xml, PDF и т.д.) принцип обработки тот же самый.
За основу взят парсер для получения списка файлов в папке, и к нему добавлено несколько команд:
- в списке действий в разделе Исходные данные добавлено действие для загрузки содержимого файла
(в данном случае это файлы Word, потому используется действие «Загрузить содержимое из файла MS Word») - на вкладке Вывод на лист добавлены столбцы, и настроена обработка содержимого файла для извлечения нужных данных
(используется действие Поиск тегов, а также текстовые функции. для разных столбцов применены разные способы извлечения данных)
При запуске парсера появляется диалоговое окно выбора ПАПКИ (в этом окне файлы не видны, — отображаются только папки и подпапки).
Выбираете папку, — и парсер начинает перебирать все файлы в этой папке, считывая из них информацию и выводя её в таблицу Excel.
Комментарии
Отправить комментарий