- Как заказать парсер сайта
- Видеоинструкции по настройке
- Возможности программы-парсера
- Действия в парсере
- Раздел «Работа с HTML»
- Раздел «Текстовые»
- Раздел «Перекодировка и форматирование»
- Раздел «Проверка и сравнение»
- Раздел «Разное»
- Раздел «Функции массива»
- Раздел «Числовые»
- Раздел «Работа с переменными»
- Раздел «Листы и книги Excel»
- Раздел «Обработка файлов из папки»
- Раздел «HTTP запрос»
- Раздел «Internet Explorer»
- Раздел «Управление парсером»
- Раздел «Веб-запросы, XML, макросы VBA»
- Недокументированные действия
- Работа с браузером (Chrome и т.п.)
- Отключенные (устаревшие) действия
- Интерфейс программы
- Использование браузера
- Ошибки при парсинге
- Вывод массива значений в одну ячейку
- Обход защиты Qrator, Incapsula и CloudFare
- Ошибка: сервер не ответил за 9 секунд
- Парсер перезаписывает данные в первой строке листа
- Невозможно запустить макрос, - нет доступа к проекту VBA
- Ошибка Compile error in hidden module
- Ошибка загрузки страницы по HTTPS (SSL Error)
- Дополнительные возможности
- Зарезервированные переменные и подстановочные коды парсера
- Кеширование страниц в парсере
- Переменные в парсере
- Обновление строк в существующей таблице при парсинге
- Переключение между наборами настроек в парсере
- Запуск мониторинга цен по расписанию
- Запуск парсера по расписанию
- Программный запуск парсера из внешнего макроса
- Доп. опции парсера (файл parser.ini)
- Наборы действий
- Прочие статьи по настройке парсера
- Коды останова парсера, и перехода на другое действие
- Плагины для парсера
- Запуск нескольких парсеров по очереди
- Обработка капчи (Captcha) в парсере
- Прокси серверы
Действие парсера «Выборка из XML» |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Параметры действия:Предназначение действия:Выполняет выборку из XML по запросу в формате XPath, и выводит массив узлов XML из значений из найденных узлов. В режиме вывода «text» (второй параметр), можно в третьем параметре задать маску текста вида {name}={@id}={brand}, где в фигурных скобках - названия извлекаемых тегов XML (name, brand) или название атрибута (id). Возвращаемое значение: результат выборки (XML или текст)
Параметр «Запрос XPath»
Параметр «Что выводить (режим вывода)»
Параметр «Название атрибута / маска текста»
Параметр «Значение по умолчанию»
Примеры использования:Простые варианты Xpath:
Ищем элементы doc (на любом уровне вложенности), и на основании каждого найденного элемента собираем результат из вложенных в него тегов:
Ну и пример посложнее, с извлечением текста текущего тега, и получением атрибутов с автоматическим их форматированием:
|
Комментарии
Используйте действие «HTML: поиск тегов», там куда больше возможностей
(и, по умолчанию, там выводятся все найденные теги)
Аналогичный вопрос интересует. Автор, откликнитесь, пожалуйста.
Если в документе несколько одинаковых тегов на одном уровне (например {image}), извлекается только первый. Как указать в поле (Название атрибута/маска текста), что извлечь нужно все?