Ручной ввод капчи (текст с картинки) используется в том случае, если капча появляется очень редко (1-2 раза) за весь процесс парсинга.
Ручной ввод капчи применим только к текстовой капче, когда нужно ввести буквы с картинки (пример страницы с такой капчей)
Для вариантов Google капчи (галочка Я не робот), этот вариант не применим.
Рассмотрим порядок действий по обходу такой капчи, с условием, что мы будет вручную вводить текст с картинки:
- загружаем страницу
- ищем на ней путь к изображению капчи
- выводим диалоговое окно ввода капчи
- запоминаем результат ввода в переменную
- выполняем POST запрос, передавая сохранённое в переменную значение как значение одного из параметров
Выглядит диалоговое окно ввода Captcha примерно так:
Действие | Параметр | Значение | Результат |
---|---|---|---|
Загрузить ИСХОДНЫЙ КОД веб-страницы | URL | http://ExcelVBA.ru/test_captcha | Исходный код веб-страницы (длиной 24328 символов) |
Кодировка веб-страницы | |||
Загружать все страницы результатов | |||
Кеширование | |||
HTML: Поиск тегов | Тип элемента | img | Ссылка: (откроется в новой вкладке) |
Название проверяемого атрибута | class | ||
Значение проверяемого атрибута | captcha_image | ||
Тип результата / извлекаемый атрибут | src_with_prefix 1 | ||
Диалоговое окно ввода Captcha | Ссылка на картинку с текстом | Текст (длиной 6 символов) |
|
Размер окна | default | ||
Текст под картинкой / вместо картинки | Введите текст с картинки | ||
Значение по умолчанию | |||
Сохранить текущее значение в переменную | Название переменной | captcha | Текст (длиной 6 символов) <без изменений> |
Область видимости | parser |
Дальнейшие действия зависят от конкретного сайта.
Обычно это POST запрос (см. видеоинструкцию по настройке POST запросов)