- Как заказать парсер сайта
- Видеоинструкции по настройке
- Возможности программы-парсера
- Действия в парсере
- Раздел «Работа с HTML»
- Раздел «Текстовые»
- Раздел «Перекодировка и форматирование»
- Раздел «Проверка и сравнение»
- Раздел «Разное»
- Раздел «Функции массива»
- Раздел «Числовые»
- Раздел «Работа с переменными»
- Раздел «Листы и книги Excel»
- Раздел «Обработка файлов из папки»
- Раздел «HTTP запрос»
- Раздел «Internet Explorer»
- Раздел «Управление парсером»
- Раздел «Веб-запросы, XML, макросы VBA»
- Недокументированные действия
- Работа с браузером (Chrome и т.п.)
- Отключенные (устаревшие) действия
- Интерфейс программы
- Использование браузера
- Ошибки при парсинге
- Вывод массива значений в одну ячейку
- Обход защиты Qrator, Incapsula и CloudFare
- Ошибка: сервер не ответил за 9 секунд
- Парсер перезаписывает данные в первой строке листа
- Невозможно запустить макрос, - нет доступа к проекту VBA
- Ошибка Compile error in hidden module
- Ошибка загрузки страницы по HTTPS (SSL Error)
- Дополнительные возможности
- Зарезервированные переменные и подстановочные коды парсера
- Кеширование страниц в парсере
- Переменные в парсере
- Обновление строк в существующей таблице при парсинге
- Переключение между наборами настроек в парсере
- Запуск мониторинга цен по расписанию
- Запуск парсера по расписанию
- Программный запуск парсера из внешнего макроса
- Доп. опции парсера (файл parser.ini)
- Наборы действий
- Прочие статьи по настройке парсера
- Коды останова парсера, и перехода на другое действие
- Плагины для парсера
- Запуск нескольких парсеров по очереди
- Обработка капчи (Captcha) в парсере
- Прокси серверы
Вкладка "Основная информация" |
Вкладка "Основная информация" - первая вкладка, которая появляется перед пользователем при открытии настроек парсера.
Для удобства разделим изображение окна на 3 блока.
Блок №1
В верхней части блока находятся навигационные кнопки, позволяющие переключаться между вкладками настроек. Кнопки "Вывод на лист" и "Загрузка файлов" появляются только при установленных галках из блока №2 - "Выполнять подстановку данных в таблицу Excel" и "Выполнять загрузку файлов" соответственно.
Ниже навигационных кнопок содержится название парсера, как оно записано в самом файле настройки (может не совпадать с именем файла) и кнопка для переименования парсера. Во избежание путаницы, старайтесь не переименовывать файлы настроек физически, а используйте для этого кнопку "Переименовать" или соответствующую возможность из блока №3.
Блок №2
Во втором блоке находятся галки, активирующие возможности парсера выводить данные на лист и загружать файлы. Важной особенностью является то, что при снятии галки соответствующие настройки из файла не удаляются, а переходят в "неактивный" режим.
Это значит, что когда нам нужно отключить загрузку файлов, мы можем снять галку "Выполнять загрузку файлов", как следствие парсер не будет загружать файлы и исчезнет навигационная кнопка "Загрузка файлов" (Блок №1). Но все действия парсера, относящиеся к загрузке файлов будут по-прежнему храниться в настройке. То есть когда нам вновь потребуется загрузка файлов, мы просто ставим галку, и настройки загрузки файлов в том виде, как мы их оставили, возвращаются на место. То же самое относится к "Выполнять подстановку данных в таблицу Excel".
Также во втором блоке находится блок быстрого доступа к переменным. Работе с данным блоком будет посвящена отдельная статья.
Блок №3
Наверху третьего блока содержится поле "Описание". Здесь удобно хранить информацию, относящуюся к работе парсера. Например, какие файлы надо открывать, какой порядок запуска при работе и т.д. Если настройкой пользуются несколько человек, то важные особенности работы с настройкой рекомендуется фиксировать здесь.
Другой распространенный способ использования данного поля: если на вкладке "Исходные данные" у нас выбран режим "Фиксированное исходное значение (или список значений)", и там есть список из нескольких ссылок, то удобно хранить копию этого списка в поле "Описание". Тогда в случае, если нам понадобится спарсить только некоторые ссылки из списка, мы всегда можем удалить лишние, не заботясь о том, что потом придется собирать список заново.
Поле "Сведения" является служебным полем парсера и не предполагает редактирования со стороны пользователя. Здесь всегда указывается дата и время последней редакции парсера, а в случае, если вы заказывали настройку на нашем сайте, также содержатся контактные данные, к кому можно обратиться по вопросам настройки данного парсера.
В самом низу третьего окна находятся кнопки "Сохранить и закрыть", "Сохранить", а также выпадающий список со следующими действиями: клонировать, переименовать, удалить, встроить в файл эксель.
Клонировать - действие, которое создает новый файл настроки - полную копию текущей настройки. При клонировании программа сразу запрашивает имя нового парсера. Если надо создать сразу несколько однотипных парсеров с разными именами, то можно написать имена будущих настроек в ячейках листа Excel (они уже могут быть написаны, например, если вы сравниваете цены на разных сайтах и каждый столбец у вас подписан в соответствии с названием сайта), затем выделить данный диапазон на листе, выбрать действие "клонировать" и вместо имени написать зарезервированное слово "selection" (без кавычек). В результате будет создано столько новых настроек, сколько ячеек было выделено, каждая со своим именем, также появится информационное окно, сообщающее сколько настроек было создано, были ли ошибки и т.д.
Функция "Встроить в файл Excel" позволяет объединить файл Excel и настройку парсера (файл .xlp) в единый файл Excel (его новый формат должен поддерживать макросы - .xlsm, например). Это может использоваться для реализации автозапуска парсера через макрос при открытии книги, это может быть удобным, когда настройка должна запускаться строго из одного исходного файла (уменьшает риск того, что пользователь забудет открыть исходный файл или что при передаче файла от пользователя к пользователю будет потерян исходный файл или настройка) и для ряда других ситуаций.
После встраивания настройки в файл на текущем листе появляются две кнопки "Начать загрузку данных с сайта" и "Посмотреть настройки парсера", все дальнейшее управление настройкой осуществляется только через эти кнопки, а в структуре книги появляется новый скрытый лист shm (ParserMacro) с макросами, необходимыми для работы настройки.
Обратную операцию по извлечению настройки в отдельный файл .xlp выполнить нельзя.
Особенностью настройки, встроенной в файл, является то, что любые изменения в настройке не сохраняются, пока не сохранен файл Excel, содержащий настройку.
Встраивание настройки в файл Excel требует от настройщика понимания основ VBA и не рекомендуется неискушенному пользователю.
- Добавить комментарий
- 5167 просмотров
Комментарии
Доброго дня!
Подскажите, как вывести на лист переименованные согласно шаблону в поле "загрузка фалов" названия картинок. . пробовал сохранять переменную в загрузке и выводить ее на лист - выводит оригинальные названия.