Парсер файлов из выбранной папки

Задача: 

Перебрать все файлы в заданной папке, и сформировать таблицу Excel с данными из этих файлов.

Описание: 

Этот парсер демонстрирует возможности парсера по извлечению данных из файлов.

Для примера взяты файлы пропусков формата Word, сформированные надстройкой FillDocuments, но для файлов другого типа (текстовых, Excel, html / xml, PDF и т.д.) принцип обработки тот же самый.

За основу взят парсер для получения списка файлов в папке, и к нему добавлено несколько команд:

  • в списке действий в разделе Исходные данные добавлено действие для загрузки содержимого файла
    (в данном случае это файлы Word, потому используется действие «Загрузить содержимое из файла MS Word»)
  • на вкладке Вывод на лист добавлены столбцы, и настроена обработка содержимого файла для извлечения нужных данных
    (используется действие Поиск тегов, а также текстовые функции. для разных столбцов применены разные способы извлечения данных)

При запуске парсера появляется диалоговое окно выбора ПАПКИ (в этом окне файлы не видны, — отображаются только папки и подпапки).
Выбираете папку, — и парсер начинает перебирать все файлы в этой папке, считывая из них информацию и выводя её в таблицу Excel.

Комментарии

Ранее запрашивал разрабоку маркос. мне рекомендовали @a_kulmashev.
Мы с ним сработались. Работа выполнена качественно и в срок.

Здравствуйте!
Сколько будет строить разработка парсера который считывает данные со сканов документов ?
в .pdf или в .jpeg. Для начала пусть будет в .pdf.
Необходимо в бюро пропусков. Для оформления.
Чтобы на входе скан в .pdf, на выходе табличные данные в формате .xls

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
 __   __   ___    _               _         
\ \ / / / _ \ | | __ __ __| | __ _
\ V / | | | | | | \ \ / / / _` | / _` |
| | | |_| | | | \ V / | (_| | | (_| |
|_| \__\_\ |_| \_/ \__,_| \__,_|
Введите код, изображенный в стиле ASCII-арт.