- Как заказать парсер сайта
- Видеоинструкции по настройке
- Возможности программы-парсера
- Действия в парсере
- Раздел «Работа с HTML»
- Раздел «Текстовые»
- Раздел «Перекодировка и форматирование»
- Раздел «Проверка и сравнение»
- Раздел «Разное»
- Раздел «Функции массива»
- Раздел «Числовые»
- Раздел «Работа с переменными»
- Раздел «Листы и книги Excel»
- Раздел «Обработка файлов из папки»
- Раздел «HTTP запрос»
- Раздел «Internet Explorer»
- Раздел «Управление парсером»
- Раздел «Веб-запросы, XML, макросы VBA»
- Недокументированные действия
- Работа с браузером (Chrome и т.п.)
- Отключенные (устаревшие) действия
- Интерфейс программы
- Использование браузера
- Ошибки при парсинге
- Вывод массива значений в одну ячейку
- Обход защиты Qrator, Incapsula и CloudFare
- Ошибка: сервер не ответил за 9 секунд
- Парсер перезаписывает данные в первой строке листа
- Невозможно запустить макрос, - нет доступа к проекту VBA
- Ошибка Compile error in hidden module
- Ошибка загрузки страницы по HTTPS (SSL Error)
- Дополнительные возможности
- Зарезервированные переменные и подстановочные коды парсера
- Кеширование страниц в парсере
- Переменные в парсере
- Обновление строк в существующей таблице при парсинге
- Переключение между наборами настроек в парсере
- Запуск мониторинга цен по расписанию
- Запуск парсера по расписанию
- Программный запуск парсера из внешнего макроса
- Доп. опции парсера (файл parser.ini)
- Наборы действий
- Прочие статьи по настройке парсера
- Коды останова парсера, и перехода на другое действие
- Плагины для парсера
- Запуск нескольких парсеров по очереди
- Обработка капчи (Captcha) в парсере
- Прокси серверы
Действие парсера «Регулярные выражения (выборка)» |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Параметры действия:Предназначение действия:Поистине неограниченные возможности обработки значений предоставляют вам регулярные выражения. Целью статьи не является описание всего многообразия регулярных выражений, подробную информацию по использованию регулярных выражений вы можете найти в интернете (введя в поисковую систему фразу типа Regexp примеры) Подробнее про использование регулярных выражений Возвращаемое значение: текст
Параметр «Шаблон Regexp»Шаблон (pattern) регулярного выражения ВАЖНО: в шаблоне регулярного выражения нельзя использовать записи вида {2} или {5} (цифра в фигурных скобках), так как парсер подсчитает это подстановочным кодом, и подставит на место значение из столбца с этим номером. Например, если нужно задать шаблон поиска \d{4} (ищем 4 цифры подряд), то надо записать это в виде \d{4,4} (ищем цифры в количестве от 4 до 4). Суть от этого не поменяется, но парсер не воспримет запись {4,4} как подстановочный код, в отличие от записи {4}.
Параметр «Тип результата»Этот параметр может быть задан в одном из 4 вариантов:
Параметр «Шаблон замены»Используется только в том случае, если тип результата задан как replace (замена) Параметр «Учитывать регистр символов»
Примеры использования:Первый параметр - шаблон Regexp - составляется на основе стандартных правил регулярных выражений.
В примере берутся все возможные комбинации между числами и тире.
Числовой тип результата задаёт индекс нужной части (целое число, начиная с 0) из результатов выборки Regexp.
Указав в качестве типа результата какой-либо текст, мы получаем массив результатов, сцепленный через этот текст:
Замена при помощи регулярных выражений, — мощнейший инструмент для парсинга Для выполнения замены средствами регулярных выражений, параметр тип результата выставляем равным replace, и задаём шаблон замены:
Можно выполнять поиск как с учётом регистра, так и без него (см. четвёртый параметр действия)
|
Комментарии
Есть подсказка по Регулярным выражениям http://www.exlab.net/files/tools/sheets/regexp/regexp.png