Настройка парсера для обработки PDF файлов

Перед использованием браузера IE для считывания данных из ПДФ файлов, нужно сделать следующее:

1Запустить надстройку «Парсер сайтов» (версия 4.2.2 или новее)

2Убедиться, что браузер Internet Explorer запускается.

B меню парсера нажмите Дополнительно — Запустить Internet Explorer

Можно и обычным способом запустить: Пуск — Программы пункт  , или Пуск — Выполнить, команда iexplore, — но в этом случае может запускаться Edge место IE

3Открыть настройки браузера INTERNET EXPLORER (скриншот), и на вкладке Безопасность для каждой из зон отключить безопасный режим (скриншот), после чего нажать ОК.

4Проверить, открываются ли файлы ПДФ в Internet Explorer

Для этого, мышкой перетаскиваем файл ПДФ из папки в окно ранее запущенного браузера Internet Explorer.
Если Internet Explorer не умеет открывать файлы PDF, то необходимо установить расширение Adobe Acrobat Reader для браузеров. Скачать это расширение можно по ссылке: https://get.adobe.com/ru/reader/

5Попробуйте выделить и скопировать текст открытого в IE файла PDF.

Для этого нажимаем комбинации клавиш Ctrl + A (выделить всё) и потом Ctrl + C (копировать), после чего переходим в текстовый редактор (Блокнот или Word) и нажимаем Ctrl + V (вставить). Если видим, что содержимое ПДФ файла скопировалось, — значит, парсер сможет обрабатывать эти файлы ПДФ.

 

В видеоролике рассказано, как настроить программой «Парсер сайтов» на сбор данных из файлов формата PDF

Статья с файлом настроек парсера из этого видео