- Как заказать парсер сайта
- Видеоинструкции по настройке
- Возможности программы-парсера
- Действия в парсере
- Раздел «Работа с HTML»
- Раздел «Текстовые»
- Раздел «Перекодировка и форматирование»
- Раздел «Проверка и сравнение»
- Раздел «Разное»
- Раздел «Функции массива»
- Раздел «Числовые»
- Раздел «Работа с переменными»
- Раздел «Листы и книги Excel»
- Раздел «Обработка файлов из папки»
- Раздел «HTTP запрос»
- Раздел «Internet Explorer»
- Раздел «Управление парсером»
- Раздел «Веб-запросы, XML, макросы VBA»
- Недокументированные действия
- Работа с браузером (Chrome и т.п.)
- Отключенные (устаревшие) действия
- Интерфейс программы
- Использование браузера
- Ошибки при парсинге
- Вывод массива значений в одну ячейку
- Обход защиты Qrator, Incapsula и CloudFare
- Ошибка: сервер не ответил за 9 секунд
- Парсер перезаписывает данные в первой строке листа
- Невозможно запустить макрос, - нет доступа к проекту VBA
- Ошибка Compile error in hidden module
- Ошибка загрузки страницы по HTTPS (SSL Error)
- Дополнительные возможности
- Зарезервированные переменные и подстановочные коды парсера
- Кеширование страниц в парсере
- Переменные в парсере
- Обновление строк в существующей таблице при парсинге
- Переключение между наборами настроек в парсере
- Запуск мониторинга цен по расписанию
- Запуск парсера по расписанию
- Программный запуск парсера из внешнего макроса
- Доп. опции парсера (файл parser.ini)
- Наборы действий
- Прочие статьи по настройке парсера
- Коды останова парсера, и перехода на другое действие
- Плагины для парсера
- Запуск нескольких парсеров по очереди
- Обработка капчи (Captcha) в парсере
- Прокси серверы
Действие парсера «Решить Google Captcha v.2» |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Параметры действия:
Предназначение действия:Выполняется запрос на платный сервис распознавания капчи RuCaptcha.com Для использования этой опции, в общих настройках программы нужно задать API-ключ сервиса (для его получения, надо зарегистрироваться на сайте RuCaptcha.com, и пополнить счёт) Результат решения капчи (токен) автоматически сохраняется в переменную с именем g-recaptcha-response Возвращаемое значение: токен, который надо передать в POST запросе (параметр g-recaptcha-response)
Параметр «URL страницы с капчей»Если URL не задан, используется последний загруженный URL, или текущее значение (если оно является ссылкой) Параметр «Ключ сайта (data-sitekey)»Ключ сайта — параметр data-sitekey из div class=g-recaptcha (если не задан, будет найден автоматически, если текущее значение — HTML код страницы) Параметр «Показывать уведомления»
Параметр «Дополнительные опции»Здесь можно задать дополнительные параметры запроса согласно API сервиса rucaptcha.com Параметр «Время ожидания ответа, сек.»
Примеры использования:Полноценная инструкция по действию будет опубликована позже. Порядок действий при обработке Captcha парсером:1) Вместо действия ЗАГРУЗИТЬ ИСХОДНЫЙ КОД ВЕБ_СТРАНИЦЫ 2) На вкладке Дополнительно, подвкладка Наборы действий, 3) В этот набор действий добавляем команды для загрузки страницы, проверки наличия на ней капчи, распознавания капчи, отправки распознанной капчи на сайт. Выглядеть список действий будет примерно так:
В процессе обработки капчи, на прогресс-баре отображается ход выполнения запроса к сервису RuCaptcha:
Еще один пример настройки обработки капчи (тоже набор действий «Загрузить страницу»), на примере сайта makeup.com.ua
|