Парсинг файлов Excel

Парсер поддерживает следующие типы файлов Excel:

  • .xls, .xlsx, xlsm, .xlsb и любые другие таблицы
  • файлы .csv можно парсить как файлы Excel и как текстовые файлы (зависит от задачи)

Для сбора данных из файлов Excel применяется стандартный алгоритм парсера файлов, но есть и некоторые нюансы:

  1. Для открытия файла используется действие «Открыть файл в Excel», с параметром «Режим» равным 2 - ReadOnly (если планируется только загрузка данных из файла, без внесения изменений в обрабатываемый файл):
    Действие Параметр Значение
    Открыть файл в Excel Путь к открываемому файлу  
    Режим 2 - ReadOnly

     

  2. ВАЖНО: Требуется принудительно закрывать обрабатываемые файлы Excel (так как файл остаётся открытым в процессе извлечения из него данных)

    Поскольку в исходных данных прописана только команда открытия файла, а команду закрытия там же прописать возможности нет, — команду закрытия добавляем в спец. набор действий с названием Parser_AfterLastLevel (он срабатывает на последнем подуровне после вывода на лист):

    Действие Параметр Значение
    Закрыть книгу Excel Режим 2 - ранее открытый парсером

     

  3. Для извлечения данных с листа используется действие «Поиск ячеек на листе».
    Оно позволяет искать на листе нужные ячейки, ориентируясь на значения соседних ячеек (например, найти на листе ячейку с заданным текстом, отступить от неё вниз/вправо/влево/вверх на заданное количество строк/столбцов, и из этой ячейки считать значение / ссылку / примечание)
    Это же действие позволяет вносить коррективы в файл перед сбором данных (например, перенести значения из одного столбца в другой, удалить лишние столбцы, посчитать количество заполненных ячеек в диапазоне, и т.п.)

 

Примеры настройки парсера файлов Excel можно найти в каталоге парсеров файлов: