Действие парсера «Загрузить страницу по ссылке»

Параметры действия:

Предназначение действия:

Действие выполняет загрузку страницы по ссылке.
Это одна из основных команд любого парсера, взаимодействующего с сайтом.

Исходным значением является URL страницы.

Доступно 4 варианта загрузки страницы (параметр «Способ загрузки»). Способ загрузки может влиять на содержимое загруженной страницы. Если способ загрузки не задан, используется значение по умолчанию, заданное в настройках парсера на вкладке Дополнительно (подвкладка Разное).

Возвращаемое значение: HTML код страницы

 


Параметр «Способ загрузки»

Тип параметра: выбор из списка предопределенных значений

Допустимые значения параметра: <не задано>; WinHTTP; WinAPI; WinInet; IE

Значение по умолчанию: <не задано>

 

Параметр «Кеширование»

Тип параметра: выбор из списка, или ввод вручную

Примеры значений параметра: <не задано>; да; нет; только запись

Значение по умолчанию: <не задано>

 

Параметр «URL (вместо исходного значения)»

Тип параметра: произвольная ссылка

Позволяет задать URL для загрузки, не изменяя текущее значение (на входе действия)
Если в этом параметре указано какое-либо значение, то оно считается ссылкой для загрузки, а значение на входе действия игнорируется.

 

Параметр «Дополнительные опции»

Тип параметра: выбор из списка, или ввод вручную

Примеры значений параметра: encoding:"utf-8"; ie-page-mask: "*SomeText*"

В большинстве случаев этот параметр изменять не требуется (оставьте это поле пустым).
 

Дополнительные опции имеют синтаксис json вида название:"значение"
Если нужно указать несколько опций одновременно, то запись будет иметь вид {название1:"значение1",название2:"значение2",название3:"значение3"}
 

Поддерживаются следующие опции:

encoding:"кодировка" — позволяет принудительно указать парсеру на кодировку ответа сервера. В 99.8% случаев парсер сам корректно определяет используемую кодировку, основываясь на заголовках ответа сервера, но иногда может потребоваться принудительно указать кодировку utf-8

ie-page-mask:"маска" — применяется только при способе загрузки «IE», и задаёт маску текста, появления которого на странице будет ждать браузер IE. Используется, когда скрипты догружают данные на страницу с задержкой, и парсер должен ожидать, пока все скрипты не закончат работу (например, скрипт подгружает актуальную цену и наличие отдельными запросами уже после того, как страница загрузилась). Маска обычно имеет вид *SomeText*, где SomeText - слово или фраза, которые появляются на странице только после завершения работу скриптов в браузере.

 

 

Примеры использования: