Парсеры файлов XML, DOC, TXT, PDF

Парсеры для обработки файлов различного типа. Парсер может обрабатывать файлы текстовых форматов (XML, TXT, CSV, HTML), а также файлы Word (DOC) и PDF
  • Обработать все файлы Excel в заданной папке, и извлечь информацию из определенных ячеек.
    Искать в файлах данные не привязываясь к адресам ячеек (структура файлов немного отличается, часть данных смещена)

  • Перебрать все файлы в заданной папке, и сформировать таблицу Excel с данными из этих файлов.

  • Получить список файлов в папке, выбираемой пользователем.
    Вывести в первый столбец имена файлов с гиперссылками.

  • Загрузить данные из выбранного текстового файла (на примере файла html), и вывести результат в таблицу Excel.

  • Собрать все данные о соискателях из файлов резюме в заданной папке, и вывести результат в таблицу Excel

  • Преобразовать базу формата Word с контактными данными, в таблицу Excel

  • Собрать сведения о среднесписочной численности работников организации из XML файлов с сайта nalog.ru
    (вывести наименование организации, ИНН, и количество работников)

  • Преобразовать файлы выписки (формата XML) из росрееестра (ЕГРН) в таблицу Excel для дальнейшего анализа

  • Создать таблицу цен на грузоперевозки между городами России,
    взяв данные из ПДФ файлов с сайта транспортной компании.

  • Реализовать обработку банковских выписок формата 1CClientBankExchange (из программы 1С) с выводом данных в Excel.
    Вывести в отдельные столбцы: название файла с выпиской, дату операции, номер документа, сумму (дебет и кредит - в отдельные столбцы), назначение платежа, тип документа, данные по контрагенту и компании, чья выписка обрабатывается (наименование организации, ИНН, расчетный счет, название банка, БИК банка)
    Из всех выписок 1С в папке, создать единый файл Excel.

  • Обработать все файлы XML в выбранной папке, и сформировать отчёт в формате Excel (одна строка таблицы Excel соответствует одному XML файлу)

  • Обработать все файлы Word в заданной папке, и сформировать новую таблицу Excel с данными из файлов Word из 9 столбцов:
    Имя файла, ФИО, Должность, Руководитель, Место, Номинация, Работа, ФИО сотрудника, Должность сотрудника