- Как заказать парсер сайта
 - Видеоинструкции по настройке
 - Возможности программы-парсера
 - Действия в парсере
Раздел «Работа с HTML»
- Раздел «Текстовые»
 - Раздел «Перекодировка и форматирование»
 - Раздел «Проверка и сравнение»
 - Раздел «Разное»
 - Раздел «Функции массива»
 - Раздел «Числовые»
 - Раздел «Работа с переменными»
 - Раздел «Листы и книги Excel»
 - Раздел «Обработка файлов из папки»
 - Раздел «HTTP запрос»
 - Раздел «Internet Explorer»
 - Раздел «Управление парсером»
 - Раздел «Веб-запросы, XML, макросы VBA»
 - Недокументированные действия
 - Раздел «ИИ (нейросети)»
 - Работа с браузером (Chrome и т.п.)
 - Отключенные (устаревшие) действия
 
 - Интерфейс программы
 - Использование браузера
 - Настройка парсера
 - Ошибки при парсинге
- Вывод массива значений в одну ячейку
 - Обход защиты Qrator, Incapsula и CloudFare
 - Ошибка: сервер не ответил за 9 секунд
 - Парсер перезаписывает данные в первой строке листа
 - Невозможно запустить макрос, - нет доступа к проекту VBA
 - Ошибка Compile error in hidden module
 - Ошибка загрузки страницы по HTTPS (SSL Error)
 
 - Дополнительные возможности
- Зарезервированные переменные и подстановочные коды парсера
 - Кеширование страниц в парсере
 - Переменные в парсере
 - Обновление строк в существующей таблице при парсинге
 - Переключение между наборами настроек в парсере
 - Запуск мониторинга цен по расписанию
 - Запуск парсера по расписанию
 - Программный запуск парсера из внешнего макроса
 - Доп. опции парсера (файл parser.ini)
 - Наборы действий
 - Прочие статьи по настройке парсера
 - Коды останова парсера, и перехода на другое действие
 - Плагины для парсера
 - Запуск нескольких парсеров по очереди
 
 - Обработка капчи (Captcha) в парсере
 - Прокси серверы
 
			Раздел «Работа с HTML» | 
		
В категории действий парсера «Работа с HTML» находятся следующие действия для загрузки и обработки HTML-кода:
- Загрузить страницу по ссылке
 - HTML: Поиск тегов
 - HTML: Преобразовать в текст
 - HTML: Получить гиперссылку и её текст
 - HTML: Получить список категорий
 - HTML: Получить все ссылки пейджера
 - HTML: Замена / изменение тегов
 - HTML: Рекурсивный поиск страниц
 - HTML: Многопоточная загрузка
 - HTML: Преобразование тегов
 - HTML: Преобразовать таблицу в список с разделителями
 - Взять цену товара
 - HTML: Удалить пробелы между тегами
 - HTML: Удалить все атрибуты в тегах
 - HTML: Удаление тегов / комментов
 - Найти переменную JavaScript
 
Действия из этого раздела являются основой любого парсера сайта.
Например, простейший парсер, загружающий страницы сайта, и выводящий название товара, артикул и описание, можно настроить, используя лишь 2 действия: «Загрузить ИСХОДНЫЙ КОД веб-страницы» и «HTML: Поиск тегов»
Все остальные действия в парсере (в этом и других разделах) — вспомогательные, предназначенные для обработки полученных результатов, упрощения и ускорения настройки, выполнения дополнительных действий.
- Добавить комментарий
 - 6073 просмотра
 










