- Как заказать парсер сайта
- Видеоинструкции по настройке
- Возможности программы-парсера
- Действия в парсере
- Раздел «Работа с HTML»
- Раздел «Текстовые»
- Раздел «Перекодировка и форматирование»
- Раздел «Проверка и сравнение»
- Раздел «Разное»
- Раздел «Функции массива»
- Раздел «Числовые»
- Раздел «Работа с переменными»
- Раздел «Листы и книги Excel»
- Раздел «Обработка файлов из папки»
- Раздел «HTTP запрос»
- Раздел «Internet Explorer»
- Раздел «Управление парсером»
- Раздел «Веб-запросы, XML, макросы VBA»
- Недокументированные действия
- Работа с браузером (Chrome и т.п.)
- Отключенные (устаревшие) действия
- Интерфейс программы
- Использование браузера
- Ошибки при парсинге
- Вывод массива значений в одну ячейку
- Обход защиты Qrator, Incapsula и CloudFare
- Ошибка: сервер не ответил за 9 секунд
- Парсер перезаписывает данные в первой строке листа
- Невозможно запустить макрос, - нет доступа к проекту VBA
- Ошибка Compile error in hidden module
- Ошибка загрузки страницы по HTTPS (SSL Error)
- Дополнительные возможности
- Зарезервированные переменные и подстановочные коды парсера
- Кеширование страниц в парсере
- Переменные в парсере
- Обновление строк в существующей таблице при парсинге
- Переключение между наборами настроек в парсере
- Запуск мониторинга цен по расписанию
- Запуск парсера по расписанию
- Программный запуск парсера из внешнего макроса
- Доп. опции парсера (файл parser.ini)
- Наборы действий
- Прочие статьи по настройке парсера
- Коды останова парсера, и перехода на другое действие
- Плагины для парсера
- Запуск нескольких парсеров по очереди
- Обработка капчи (Captcha) в парсере
- Прокси серверы
Ручной ввод текстовой капчи |
Ручной ввод капчи (текст с картинки) используется в том случае, если капча появляется очень редко (1-2 раза) за весь процесс парсинга.
Ручной ввод капчи применим только к текстовой капче, когда нужно ввести буквы с картинки (пример страницы с такой капчей)
Для вариантов Google капчи (галочка Я не робот), этот вариант не применим.
Рассмотрим порядок действий по обходу такой капчи, с условием, что мы будет вручную вводить текст с картинки:
- загружаем страницу
- ищем на ней путь к изображению капчи
- выводим диалоговое окно ввода капчи
- запоминаем результат ввода в переменную
- выполняем POST запрос, передавая сохранённое в переменную значение как значение одного из параметров
Выглядит диалоговое окно ввода Captcha примерно так:
Действие | Параметр | Значение | Результат |
---|---|---|---|
Загрузить ИСХОДНЫЙ КОД веб-страницы | URL | http://ExcelVBA.ru/test_captcha | Исходный код веб-страницы (длиной 24328 символов) |
Кодировка веб-страницы | |||
Загружать все страницы результатов | |||
Кеширование | |||
HTML: Поиск тегов | Тип элемента | img | Ссылка: (откроется в новой вкладке) |
Название проверяемого атрибута | class | ||
Значение проверяемого атрибута | captcha_image | ||
Тип результата / извлекаемый атрибут | src_with_prefix 1 | ||
Диалоговое окно ввода Captcha | Ссылка на картинку с текстом | Текст (длиной 6 символов) |
|
Размер окна | default | ||
Текст под картинкой / вместо картинки | Введите текст с картинки | ||
Значение по умолчанию | |||
Сохранить текущее значение в переменную | Название переменной | captcha | Текст (длиной 6 символов) <без изменений> |
Область видимости | parser |
Дальнейшие действия зависят от конкретного сайта.
Обычно это POST запрос (см. видеоинструкцию по настройке POST запросов)
- Добавить комментарий
- 2407 просмотров