- Как заказать парсер сайта
- Видеоинструкции по настройке
- Возможности программы-парсера
- Действия в парсере
- Раздел «Работа с HTML»
- Раздел «Текстовые»
- Раздел «Перекодировка и форматирование»
- Раздел «Проверка и сравнение»
- Раздел «Разное»
- Раздел «Функции массива»
- Раздел «Числовые»
- Раздел «Работа с переменными»
- Раздел «Листы и книги Excel»
- Раздел «Обработка файлов из папки»
- Раздел «HTTP запрос»
- Раздел «Internet Explorer»
- Раздел «Управление парсером»
- Раздел «Веб-запросы, XML, макросы VBA»
- Недокументированные действия
- Работа с браузером (Chrome и т.п.)
- Отключенные (устаревшие) действия
- Интерфейс программы
- Использование браузера
- Ошибки при парсинге
- Вывод массива значений в одну ячейку
- Обход защиты Qrator, Incapsula и CloudFare
- Ошибка: сервер не ответил за 9 секунд
- Парсер перезаписывает данные в первой строке листа
- Невозможно запустить макрос, - нет доступа к проекту VBA
- Ошибка Compile error in hidden module
- Ошибка загрузки страницы по HTTPS (SSL Error)
- Дополнительные возможности
- Зарезервированные переменные и подстановочные коды парсера
- Кеширование страниц в парсере
- Переменные в парсере
- Обновление строк в существующей таблице при парсинге
- Переключение между наборами настроек в парсере
- Запуск мониторинга цен по расписанию
- Запуск парсера по расписанию
- Программный запуск парсера из внешнего макроса
- Доп. опции парсера (файл parser.ini)
- Наборы действий
- Прочие статьи по настройке парсера
- Коды останова парсера, и перехода на другое действие
- Плагины для парсера
- Запуск нескольких парсеров по очереди
- Обработка капчи (Captcha) в парсере
- Прокси серверы
Действие парсера «HTML: Получить список категорий» |
||||||||||||||||||||||||
Действие предназначено для быстрого извлечения списка категорий из строки навигации (Breadcrumbs). Можно отбросить несколько первых значений (например, «Главная» или «Каталог»), или несколько последних (если последним пунктом идёт название товара). Действие имеет 3 параметра:
Действие является комбинацией следующих действий: Возвращаемое значение: массив из нескольких текстовых значений.Параметр «HTML фильтры (например, class=navigation)»В данном параметре можно указать парсеру, внутри какого тега надо искать ссылки. Зачастую это помогает получить нужный результат. Синтаксис допускает следующие способы указания нужного тега:
Если фильтр задан неправильно, то появится сообщение: Применён HTML фильтр
Параметр «Начать с элемента с номером»Указывает, с номера какой категории нужно формировать массив ссылок.
Параметр «Удалить последние в количестве»Указывает, какое количество последних категорий нужно отбросить при формировании массива ссылок.
Примеры использования:Имеется страница товара с категориями Главная -> Бизнес-литература -> Саморазвитие. Мотивация.
|