Парсер файлов из выбранной папки

Задача: 

Перебрать все файлы в заданной папке, и сформировать таблицу Excel с данными из этих файлов.

Описание: 

Этот парсер демонстрирует возможности парсера по извлечению данных из файлов.

Для примера взяты файлы пропусков формата Word, сформированные надстройкой FillDocuments, но для файлов другого типа (текстовых, Excel, html / xml, PDF и т.д.) принцип обработки тот же самый.

За основу взят парсер для получения списка файлов в папке, и к нему добавлено несколько команд:

  • в списке действий в разделе Исходные данные добавлено действие для загрузки содержимого файла
    (в данном случае это файлы Word, потому используется действие «Загрузить содержимое из файла MS Word»)
  • на вкладке Вывод на лист добавлены столбцы, и настроена обработка содержимого файла для извлечения нужных данных
    (используется действие Поиск тегов, а также текстовые функции. для разных столбцов применены разные способы извлечения данных)

При запуске парсера появляется диалоговое окно выбора ПАПКИ (в этом окне файлы не видны, — отображаются только папки и подпапки).
Выбираете папку, — и парсер начинает перебирать все файлы в этой папке, считывая из них информацию и выводя её в таблицу Excel.

Комментарии

Ранее запрашивал разрабоку маркос. мне рекомендовали @a_kulmashev.
Мы с ним сработались. Работа выполнена качественно и в срок.

Здравствуйте!
Сколько будет строить разработка парсера который считывает данные со сканов документов ?
в .pdf или в .jpeg. Для начала пусть будет в .pdf.
Необходимо в бюро пропусков. Для оформления.
Чтобы на входе скан в .pdf, на выходе табличные данные в формате .xls

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
                  ____    _____  __        __   ____ 
_ __ _ _ | _ \ | ___| \ \ / / / ___|
| '_ \ | | | | | | | | | |_ \ \ /\ / / | |
| |_) | | |_| | | |_| | | _| \ V V / | |___
| .__/ \__, | |____/ |_| \_/\_/ \____|
|_| |___/
Введите код, изображенный в стиле ASCII-арт.