- Как заказать парсер сайта
- Видеоинструкции по настройке
- Возможности программы-парсера
- Действия в парсере
- Раздел «Работа с HTML»
- Раздел «Текстовые»
- Раздел «Перекодировка и форматирование»
- Раздел «Проверка и сравнение»
- Раздел «Разное»
- Раздел «Функции массива»
- Раздел «Числовые»
- Раздел «Работа с переменными»
- Раздел «Листы и книги Excel»
- Раздел «Обработка файлов из папки»
- Раздел «HTTP запрос»
- Раздел «Internet Explorer»
- Раздел «Управление парсером»
- Раздел «Веб-запросы, XML, макросы VBA»
- Недокументированные действия
- Работа с браузером (Chrome и т.п.)
- Отключенные (устаревшие) действия
- Интерфейс программы
- Использование браузера
- Ошибки при парсинге
- Вывод массива значений в одну ячейку
- Обход защиты Qrator, Incapsula и CloudFare
- Ошибка: сервер не ответил за 9 секунд
- Парсер перезаписывает данные в первой строке листа
- Невозможно запустить макрос, - нет доступа к проекту VBA
- Ошибка Compile error in hidden module
- Ошибка загрузки страницы по HTTPS (SSL Error)
- Дополнительные возможности
- Зарезервированные переменные и подстановочные коды парсера
- Кеширование страниц в парсере
- Переменные в парсере
- Обновление строк в существующей таблице при парсинге
- Переключение между наборами настроек в парсере
- Запуск мониторинга цен по расписанию
- Запуск парсера по расписанию
- Программный запуск парсера из внешнего макроса
- Доп. опции парсера (файл parser.ini)
- Наборы действий
- Прочие статьи по настройке парсера
- Коды останова парсера, и перехода на другое действие
- Плагины для парсера
- Запуск нескольких парсеров по очереди
- Обработка капчи (Captcha) в парсере
- Прокси серверы
Исходные данные для парсера |
В программе предусмотрено 5 режимов для исходных данных:
- Режим «Брать данные с листа Excel из заданного столбца»
Используется, когда исходными данными для парсера выступают данные, находящиеся в таблице Excel (например, столбец с артикулами или ссылками).
Также этот режим нужен для обработки файлов Excel (из одного файла Excel создать другой файл Excel, с перестановкой столбцов и обработкой данных)
Привязка идет к конкретному столбцу по НОМЕРУ столбца.
- Режим «Использовать диапазон числовых значений»
Не используется. Оставлен в целях совместимости.
Можно задать диапазон чисел (от и до), которые парсер будет перебирать, используя в качестве исходных значений.
- Режим «Фиксированное исходное значение (или список значений)»
Наиболее часто в парсерах используем именно этот режим.
Если парсер обрабатывает сайт целиком, исходное значение вообще не задаётся, а при обработке заданных разделов сайта здесь можно указать ссылки на интересующие разделы сайта
- Режим «Брать данные с листа Excel из найденного столбца»
Используется для задачи мониторинга цен по ссылкам. Парсер ищет в открытом файле Excel столбец с заданным названием, и использует значения (ссылки) из этого столбца в качестве исходных данных.
Привязка идёт к конкретному столбцу, по НАЗВАНИЮ столбца.
Применяется, когда для одного файла Excel нужно создать несколько разных парсеров.
- Режим «Искать все ячейки / гиперссылки в диапазоне»
Используется для задачи мониторинга цен по ссылкам. Парсер ищет в открытом файле Excel все ячейки со ссылками на заданный сайт, и использует найденные ячейки в качестве исходных данных (результат обычно выводится в те же ячейки).
Применяется, когда для одного файла Excel нужно создать несколько разных парсеров.
Для разных задач парсинга применяются различные режимы.
В подавляющем большинстве случаев используется режим «Фиксированное исходное значение (или список значений)»
- Добавить комментарий
- 4742 просмотра