- Как заказать парсер сайта
- Видеоинструкции по настройке
- Возможности программы-парсера
- Действия в парсере
- Раздел «Работа с HTML»
- Раздел «Текстовые»
- Раздел «Перекодировка и форматирование»
- Раздел «Проверка и сравнение»
- Раздел «Разное»
- Раздел «Функции массива»
- Раздел «Числовые»
- Раздел «Работа с переменными»
- Раздел «Листы и книги Excel»
- Раздел «Обработка файлов из папки»
- Раздел «HTTP запрос»
- Раздел «Internet Explorer»
- Раздел «Управление парсером»
- Раздел «Веб-запросы, XML, макросы VBA»
- Недокументированные действия
- Работа с браузером (Chrome и т.п.)
- Отключенные (устаревшие) действия
- Интерфейс программы
- Использование браузера
- Ошибки при парсинге
- Вывод массива значений в одну ячейку
- Обход защиты Qrator, Incapsula и CloudFare
- Ошибка: сервер не ответил за 9 секунд
- Парсер перезаписывает данные в первой строке листа
- Невозможно запустить макрос, - нет доступа к проекту VBA
- Ошибка Compile error in hidden module
- Ошибка загрузки страницы по HTTPS (SSL Error)
- Дополнительные возможности
- Зарезервированные переменные и подстановочные коды парсера
- Кеширование страниц в парсере
- Переменные в парсере
- Обновление строк в существующей таблице при парсинге
- Переключение между наборами настроек в парсере
- Запуск мониторинга цен по расписанию
- Запуск парсера по расписанию
- Программный запуск парсера из внешнего макроса
- Доп. опции парсера (файл parser.ini)
- Наборы действий
- Прочие статьи по настройке парсера
- Коды останова парсера, и перехода на другое действие
- Плагины для парсера
- Запуск нескольких парсеров по очереди
- Обработка капчи (Captcha) в парсере
- Прокси серверы
Вкладка "Исходные данные" |
"Исходные данные" - это вкладка, на которой указываются действия по обработке данных, предшествующие выводу на лист.
Можно образно сказать, что здесь загружаются, формируются или обрабатываются данные перед тем, как парсинг переходит к выводу на лист или к скачиванию файлов.
Вкладка состоит из двух блоков: верхний (Источник данных) и нижний (Список действий). Верхний блок также имеет несколько вариантов отображения в зависимости от выбранного через выпадающий список режима.
В программе реализованы 5 режимов для исходных данных
Задачей блока "Источник данных" является формирование массива исходных значений, которые по одному будут передаваться на первый уровень списка действий и подставляться в поле "Исходное значение" редактора списка действий (на скриншоте ниже выделено красным).
Реальной подстановки в поле значений не происходит. В данном контексте слово "подставляется" используется лишь для объяснения механизмов работы парсера.
То есть, если мы выбрали режим "Брать данные с листа Excel из заданного столбца" и указали столбец 1 "A" в качестве источника данных, то из этого столбца значения ячеек по одному будут подставляться в поле исходное значение (на скриншоте). И если в 1 столбце, например, было 10 ссылок, то парсер будет обрабатывать данные ссылки по одной.
Точно так же парсер будет работать для всех других режимов блока "Источник данных". Значения передаются по одному.
Список действий представляет из себя набор уровней (подуровней), каждый из которых является для последующего источником исходных значений. Взаимосвязь каждого уровня с последующим такая же, как между блоками "Источник данных" и "Список действий" - значения переходят с уровня на подуровень по одному.
Например, на первом уровне мы получили массив из 10 значений. Каждое из этих значений переходит по одному на 2 подуровень, где в результате преобразований мы получаем массив из 5 значений. Каждое из этих значений переходит по одному либо на следующий подуровень, либо если его нет - на вывод на лист или на загрузку файлов (в этом случае мы получим 10 * 5 = 50 строк).
Если в результате обработки данных списком действий мы получаем на самом "нижнем" подуровне пустое значение, то дальнейшего перехода к выводу на лист или к скачиванию файлов не происходит (с оговоркой, написанной в информационной сноске ниже). Поэтому если вам нужно, чтобы любое исходное значение было отражено на выходе (например, в новом формируемом файле), нужно быть уверенным в том, что значение "на выходе" вкладки "Исходные данные" будет не пустым. Для этого можно использовать, например, действие из раздела "Текстовые" - "Значение по умолчанию".
Данное правило не работает в случае перехода между уровнями. Если на выходе 1 уровня будет пустое значение, то действия второго подуровня все равно будут запущены. Это нужно учитывать при создании сложных настроек.
Если быть точным, то определение - перейдет ли парсер к действиям столбцов вывода на лист или нет - происходит на подвкладке "Дополнительно" вкладки "Вывод на лист". То же самое касается подвкладки "Дополнительно" вкладки "Загрузка файлов". Однако ввиду того, что данные подвкладки используется крайне редко и чаще всего остаются пустыми, в контексте данной статьи можно пренебречь ими.
Кнопка "Run ParserStart" отображается только при включенном в общих настройках программы "Режиме разработчика". Её функция - запуск специального набора действий "ParserStart". Используется, например, в тех случаях, когда нужно протестировать работу парсера и быстро пройти авторизацию (без перехода на вкладку "Дополнительно", подвкладку "Наборы действий" и т.д.)
Кнопка "Редактировать список действий" открывает второе окно программы - окно редактора списка действий. Редактируемый уровень выбирается переключателем "Текущий уровень". Также возможно перемещаться на нижележащий уровень при помощи кнопки "Перейти на подуровень ...". Если ниже нет никакого уровня, то кнопка меняется на "Добавить подуровень ...".
Справа от переключателя "Текущий уровень" находится кнопка удаления подуровня и всех его действий. Данное действие нельзя отменить.
Справа от кнопки "Редактировать список действий" находится кнопка вставки разрыва подуровней (она появляется только при условии, что в списке действий слева выбрано какое-либо действие). На скриншоте отмечена красным.
Данная кнопка сдвигает все нижележащие подуровни (если они существуют) на один уровень ниже, а действия из текущего подуровня ниже выделенной строки переносятся на следующий уровень (на скриншоте это действия ниже выделенного второго действия). После нажатия на кнопку список действий будет выглядеть следующим образом.
Выделенное действие и всё, что "выше", осталось на месте. 3 и 4 действие перешли на 2 подуровень. Если бы в настройке до нажатия кнопки был подуровень №2, он бы стал подуровнем №3.
Кстати, обратите внимание, что сейчас на скриншоте не выделено ни одно действие, как следствие кнопка вставки разрыва не видна.
- Добавить комментарий
- 7373 просмотра
Комментарии
Что значит «не открывается»?
Не открывается вкладка "Исходные данные" в настройке парсера. Как возобновить редактирование ?
Сергей, ну так вы вывод на лист не настраивали вообще, - потому и не выводятся никакие данные никуда.
Посмотрите готовое решение для сайта ВБ: https://excelvba.ru/programmes/Parser/samples/wildberries.ru
Установил скачанный файл для парсинга с вайлдберриз, запустил, указал страничку от куда получать информациюhttps://disk.yandex.ru/i/PsKldPB3IoME2g, в окне список действий выбрал Загрузить страницу по ссылке https://disk.yandex.ru/i/-ABwgM2mS9NZYg закрыл с сохранением, нажал нга кнопку Загрузка данных https://disk.yandex.ru/i/fR0q8GLgNy5IhQ после чего выскочило окно обозначающие что начались выполнятся какие то действия, но в итоге лист эксель так и остался пустым. Прошу подсказать в чем причина, того, что не чего не загружается?
URL надо указывать в поле «Исходное значение для тестирования» (под списком действий)
Не понятно как передать данные между блоками "Источник данных" и "Список действий".
Если я, к примеру, в "Источнике данных" выбираю "Фиксированное исходное значение", а "Списке действий" первым действием ставлю "Загрузить ИСХОДНЫЙ КОД веб-страницы", то что нужно написать в его поле "Параметры"???
Если оставить его пустым, то выдаёт ошибку - не указан URL загружаемой страницы
Александр, а не надо никак обращаться
Парсер сам будет подавать эти значения (по очереди) на вход парсера
Не совсем понятно как обратиться к данным, загруженным режимом "Брать данные с листа Excel из заданного столбца". Может полученный массив храниться в какой-то переменной? Пробовал все возможные {1!} {1@} {1!} {value} {1}. Нигде данных нет.