- Как заказать парсер сайта
- Видеоинструкции по настройке
- Возможности программы-парсера
- Действия в парсере
- Раздел «Работа с HTML»
- Раздел «Текстовые»
- Раздел «Перекодировка и форматирование»
- Раздел «Проверка и сравнение»
- Раздел «Разное»
- Раздел «Функции массива»
- Раздел «Числовые»
- Раздел «Работа с переменными»
- Раздел «Листы и книги Excel»
- Раздел «Обработка файлов из папки»
- Раздел «HTTP запрос»
- Раздел «Internet Explorer»
- Раздел «Управление парсером»
- Раздел «Веб-запросы, XML, макросы VBA»
- Недокументированные действия
- Работа с браузером (Chrome и т.п.)
- Отключенные (устаревшие) действия
- Интерфейс программы
- Использование браузера
- Ошибки при парсинге
- Вывод массива значений в одну ячейку
- Обход защиты Qrator, Incapsula и CloudFare
- Ошибка: сервер не ответил за 9 секунд
- Парсер перезаписывает данные в первой строке листа
- Невозможно запустить макрос, - нет доступа к проекту VBA
- Ошибка Compile error in hidden module
- Ошибка загрузки страницы по HTTPS (SSL Error)
- Дополнительные возможности
- Зарезервированные переменные и подстановочные коды парсера
- Кеширование страниц в парсере
- Переменные в парсере
- Обновление строк в существующей таблице при парсинге
- Переключение между наборами настроек в парсере
- Запуск мониторинга цен по расписанию
- Запуск парсера по расписанию
- Программный запуск парсера из внешнего макроса
- Доп. опции парсера (файл parser.ini)
- Наборы действий
- Прочие статьи по настройке парсера
- Коды останова парсера, и перехода на другое действие
- Плагины для парсера
- Запуск нескольких парсеров по очереди
- Обработка капчи (Captcha) в парсере
- Прокси серверы
Действие парсера «Проверка на 2 условия» |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Параметры действия:
Предназначение действия:Выполняет проверку исходного значения на 2 условия Исходными значением для функции обычно является исходный код веб-страницы (или часть HTML кода страницы). Возвращаемое значение: текст (один из 3 вариантов)
Параметр «Признак результата 1 («да»)»Необязательный параметр, если указан Признак результата 2 Параметр «Признак результата 2 («нет»)»Необязательный параметр, если указан Признак результата 1 Параметр «HTML фильтры»Позволяет взять нужную часть HTML кода для проверки, без добавления предварительного действия «HTML: Поиск тегов» Параметр «Значения результата ( да|нет|не распознано )»Три значения, введённые через разделитель | (вертикальная черта) Здесь мы указываем, что будет возвращено в результат после выполнения проверок: задаём 3 варианта значений, с разделителем |, например: в наличии|под заказ|нет данных.
Примеры использования:
Проверяем текстовую строку на присутствие в ней слов «текст» и «слово»: Если найдется «текст» - в результат попадёт «да», если найдется «слово» - результатом будет «нет».
Если оба условия выполнены, - в результат попадёт третье значение результата (не распознано)
Это действие удобно использовать для проверки наличия товара:
Можно указать НЕСКОЛЬКО вариантов масок для каждого из условий (первые 2 параметра), через разделитель | (вертикальная черта).
Если наличие товара определяется появлением кнопки «В корзину», можно задать HTML-фильтр div class=InStock для поиска этой кнопки, и указать лишь одну маску для результата «Да» (перед проверкой исходное значение будет обработано - будет выполнен поиск первого тега div class=InStock):
|
Комментарии
Без примера, сложно ответить
Зависит от вложенности тегов, и прочих нюансов
Как указать парсеру, что если следующий после него тег идет с определенными параметрами, то этот тег не добавляем в массив?
Параметры:
LIKE
*/en/catalog/####/*
удалить
Как указать парсеру, используя "проверку выполнения условия", что нужно не принимать ссылки типа: /en/catalog/{четырехзначное число}/{любое значение будь тут буква или цифра}