Вкладка "Исходные данные"

"Исходные данные" - это вкладка, на которой указываются действия по обработке данных, предшествующие выводу на лист.

Можно образно сказать, что здесь загружаются, формируются или обрабатываются данные перед тем, как парсинг переходит к выводу на лист или к скачиванию файлов.

Вкладка состоит из двух блоков: верхний (Источник данных) и нижний (Список действий). Верхний блок также имеет несколько вариантов отображения в зависимости от выбранного через выпадающий список режима.

  1. Источник данных
  2. Список действий

Вкладка парсера Исходные данные

 

Блок Источник данных

В программе реализованы 5 режимов для исходных данных

Задачей блока "Источник данных" является формирование массива исходных значений, которые по одному будут передаваться на первый уровень списка действий и подставляться в поле "Исходное значение" редактора списка действий (на скриншоте ниже выделено красным).

Реальной подстановки в поле значений не происходит. В данном контексте слово "подставляется" используется лишь для объяснения механизмов работы парсера.

То есть, если мы выбрали режим "Брать данные с листа Excel из заданного столбца" и указали столбец 1 "A" в качестве источника данных, то из этого столбца значения ячеек по одному будут подставляться в поле исходное значение (на скриншоте). И если в 1 столбце, например, было 10 ссылок, то парсер будет обрабатывать данные ссылки по одной.

Точно так же парсер будет работать для всех других режимов блока "Источник данных". Значения передаются по одному.

 

Блок Список действий

Список действий представляет из себя набор уровней (подуровней), каждый из которых является для последующего источником исходных значений. Взаимосвязь каждого уровня с последующим такая же, как между блоками "Источник данных" и "Список действий" - значения переходят с уровня на подуровень по одному.

Например, на первом уровне мы получили массив из 10 значений. Каждое из этих значений переходит по одному на 2 подуровень, где в результате преобразований мы получаем массив из 5 значений. Каждое из этих значений переходит по одному либо на следующий подуровень, либо если его нет - на вывод на лист или на загрузку файлов (в этом случае мы получим 10 * 5 = 50 строк).

Если в результате обработки данных списком действий мы получаем на самом "нижнем" подуровне пустое значение, то дальнейшего перехода к выводу на лист или к скачиванию файлов не происходит (с оговоркой, написанной в информационной сноске ниже). Поэтому если вам нужно, чтобы любое исходное значение было отражено на выходе (например, в новом формируемом файле), нужно быть уверенным в том, что значение "на выходе" вкладки "Исходные данные" будет не пустым. Для этого можно использовать, например, действие из раздела "Текстовые" - "Значение по умолчанию".

Данное правило не работает в случае перехода между уровнями. Если на выходе 1 уровня будет пустое значение, то действия второго подуровня все равно будут запущены. Это нужно учитывать при создании сложных настроек.

Если быть точным, то определение - перейдет ли парсер к действиям столбцов вывода на лист или нет - происходит на подвкладке "Дополнительно" вкладки "Вывод на лист". То же самое касается подвкладки "Дополнительно" вкладки "Загрузка файлов". Однако ввиду того, что данные подвкладки используется крайне редко и чаще всего остаются пустыми, в контексте данной статьи можно пренебречь ими.

Кнопка "Run ParserStart" отображается только при включенном в общих настройках программы "Режиме разработчика". Её функция - запуск специального набора действий "ParserStart". Используется, например, в тех случаях, когда нужно протестировать работу парсера и быстро пройти авторизацию (без перехода на вкладку "Дополнительно", подвкладку "Наборы действий" и т.д.)

Кнопка "Редактировать список действий" открывает второе окно программы - окно редактора списка действий. Редактируемый уровень выбирается переключателем "Текущий уровень". Также возможно перемещаться на нижележащий уровень при помощи кнопки "Перейти на подуровень ...". Если ниже нет никакого уровня, то кнопка меняется на "Добавить подуровень ...".

Справа от переключателя "Текущий уровень" находится кнопка удаления подуровня и всех его действий. Данное действие нельзя отменить.

Справа от кнопки "Редактировать список действий" находится кнопка вставки разрыва подуровней (она появляется только при условии, что в списке действий слева выбрано какое-либо действие). На скриншоте отмечена красным.

Данная кнопка сдвигает все нижележащие подуровни (если они существуют) на один уровень ниже, а действия из текущего подуровня ниже выделенной строки переносятся на следующий уровень (на скриншоте это действия ниже выделенного второго действия). После нажатия на кнопку список действий будет выглядеть следующим образом.

Выделенное действие и всё, что "выше", осталось на месте. 3 и 4 действие перешли на 2 подуровень. Если бы в настройке до нажатия кнопки был подуровень №2, он бы стал подуровнем №3.

Кстати, обратите внимание, что сейчас на скриншоте не выделено ни одно действие, как следствие кнопка вставки разрыва не видна.

Комментарии

URL надо указывать в поле «Исходное значение для тестирования» (под списком действий)

Не понятно как передать данные между блоками "Источник данных" и "Список действий".
Если я, к примеру, в "Источнике данных" выбираю "Фиксированное исходное значение", а "Списке действий" первым действием ставлю "Загрузить ИСХОДНЫЙ КОД веб-страницы", то что нужно написать в его поле "Параметры"???
Если оставить его пустым, то выдаёт ошибку - не указан URL загружаемой страницы

Александр, а не надо никак обращаться
Парсер сам будет подавать эти значения (по очереди) на вход парсера

Не совсем понятно как обратиться к данным, загруженным режимом "Брать данные с листа Excel из заданного столбца". Может полученный массив храниться в какой-то переменной? Пробовал все возможные {1!} {1@} {1!} {value} {1}. Нигде данных нет.