- Как заказать парсер сайта
- Видеоинструкции по настройке
- Возможности программы-парсера
- Действия в парсере
- Раздел «Работа с HTML»
- Раздел «Текстовые»
- Раздел «Перекодировка и форматирование»
- Раздел «Проверка и сравнение»
- Раздел «Разное»
- Раздел «Функции массива»
- Раздел «Числовые»
- Раздел «Работа с переменными»
- Раздел «Листы и книги Excel»
- Раздел «Обработка файлов из папки»
- Раздел «HTTP запрос»
- Раздел «Internet Explorer»
- Раздел «Управление парсером»
- Раздел «Веб-запросы, XML, макросы VBA»
- Недокументированные действия
- Работа с браузером (Chrome и т.п.)
- Отключенные (устаревшие) действия
- Интерфейс программы
Использование браузера
- Ошибки при парсинге
- Вывод массива значений в одну ячейку
- Обход защиты Qrator, Incapsula и CloudFare
- Ошибка: сервер не ответил за 9 секунд
- Парсер перезаписывает данные в первой строке листа
- Невозможно запустить макрос, - нет доступа к проекту VBA
- Ошибка Compile error in hidden module
- Ошибка загрузки страницы по HTTPS (SSL Error)
- Дополнительные возможности
- Зарезервированные переменные и подстановочные коды парсера
- Кеширование страниц в парсере
- Переменные в парсере
- Обновление строк в существующей таблице при парсинге
- Переключение между наборами настроек в парсере
- Запуск мониторинга цен по расписанию
- Запуск парсера по расписанию
- Программный запуск парсера из внешнего макроса
- Доп. опции парсера (файл parser.ini)
- Наборы действий
- Прочие статьи по настройке парсера
- Коды останова парсера, и перехода на другое действие
- Плагины для парсера
- Запуск нескольких парсеров по очереди
- Обработка капчи (Captcha) в парсере
- Прокси серверы
Использование браузера |
Начиная с версии 4.0.0, надстройка «Парсер сайтов» позволяет использовать современные браузеры (Chrome, Edge, Mozilla, Opera) для взаимодействия с сайтами.
Данный функционал обеспечивается при помощи инструмента Selenium, и потребует установки дополнительного ПО (инструкция по установке)
Использование браузера поможет решить следующие задачи:
- обойти защиту сайтов, выполняющих проверку на браузер (крупные интернет площадки)
- загружать страницы сайтов, которые не открываются в Internet Explorer
- автоматизировать заполнение сложных форм на сайте данными из Excel
- парсить ПДФ файлы
- делать скриншоты страниц сайта
Какой браузер можно / лучше использовать?
- парсер поддерживает все современные браузеры, которые можно установить под Windows: это Chrome, Edge, Mozilla и Opera.
- устаревший браузер Internet Explorer тоже поддерживает этот функционал, но им не имеет смысла пользоваться
- весь функционал тестируется прежде всего на браузере Google Chrome, потому желательно использовать именно его
- если стоит задача обходить защиту сайтов от DDoS (типа QRATOR), то нужен именно Chrome
(на данный момент, только в нём реализован обход систем защиты, проверяющих факт управления браузером сторонней программой типа Selenium)
Нужно ли использовать браузер для загрузки страниц?
- для подавляющего большинства сайтов — нет, не нужно
Используйте действие «Загрузить страницу по ссылке» с режимом загрузки WinHTTP / WinAPI / WinINET — этот способ будет работать намного быстрее, поскольку загружается намного меньше данных (только HTML код страницы, без картинок и прочего) - браузер нужен, если основные данные на странице выводятся сложными скриптами, разобраться в работе которых не получается, или же просто не хочется тратить на это время, либо если обычный способ загрузки страницы не даёт результата (срабатывает защита, выводится сообщение об устаревшем браузере, и т.п.)
Как использовать браузер для парсинга?
- Устанавливаем дополнительное ПО согласно этой инструкции
- Изучаем команды парсера для работы с браузером
- Если парсер уже был ранее настроен без использования браузера, а сейчас перестал работать из-за того, что сайт стал открываться только в современных браузерах (а в IE не работает), то достаточно будет поменять режим загрузки в действии «Загрузить страницу по ссылке» - выбрать режим загрузки Browser
- Добавить комментарий
- 1007 просмотров
Комментарии
Здравствуйте, Алексей.
Все современные браузеры - хромоподобные (на движке Chromium сделаны)
Так что нет разницы, какой из браузеров использовать для работы с сайтом.
Я проверял работу программы с 4 указанными в статье браузерами.
Яндекс браузер не добавлял в программу, и не проверял.
По сути, это обычный Хром, с измененным названием, — потому, не вижу смысла вообще использовать вариант от Яндекса.
(да и не могу гарантировать, что драйвер для Chrome будет корректно работать с форком браузера от Яндекс)
День добрый, Игорь!
А поддерживается только сам Хром, а другие хромоподобные типа Яндекс-браузера не поддерживаются?