Парсер файлов из выбранной папки

Задача: 

Перебрать все файлы в заданной папке, и сформировать таблицу Excel с данными из этих файлов.

Описание: 

Этот парсер демонстрирует возможности парсера по извлечению данных из файлов.

Для примера взяты файлы пропусков формата Word, сформированные надстройкой FillDocuments, но для файлов другого типа (текстовых, Excel, html / xml, PDF и т.д.) принцип обработки тот же самый.

За основу взят парсер для получения списка файлов в папке, и к нему добавлено несколько команд:

  • в списке действий в разделе Исходные данные добавлено действие для загрузки содержимого файла
    (в данном случае это файлы Word, потому используется действие «Загрузить содержимое из файла MS Word»)
  • на вкладке Вывод на лист добавлены столбцы, и настроена обработка содержимого файла для извлечения нужных данных
    (используется действие Поиск тегов, а также текстовые функции. для разных столбцов применены разные способы извлечения данных)

При запуске парсера появляется диалоговое окно выбора ПАПКИ (в этом окне файлы не видны, — отображаются только папки и подпапки).
Выбираете папку, — и парсер начинает перебирать все файлы в этой папке, считывая из них информацию и выводя её в таблицу Excel.

Комментарии

Ранее запрашивал разрабоку маркос. мне рекомендовали @a_kulmashev.
Мы с ним сработались. Работа выполнена качественно и в срок.

Здравствуйте!
Сколько будет строить разработка парсера который считывает данные со сканов документов ?
в .pdf или в .jpeg. Для начала пусть будет в .pdf.
Необходимо в бюро пропусков. Для оформления.
Чтобы на входе скан в .pdf, на выходе табличные данные в формате .xls

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
  _   _   __  __   ____                            
| \ | | | \/ | |___ \ __ _ __ __ ___
| \| | | |\/| | __) | / _` | \ \ /\ / / / __|
| |\ | | | | | / __/ | (_| | \ V V / | (__
|_| \_| |_| |_| |_____| \__, | \_/\_/ \___|
|_|
Введите код, изображенный в стиле ASCII-арт.