- Как заказать парсер сайта
- Видеоинструкции по настройке
- Возможности программы-парсера
- Действия в парсере
- Раздел «Работа с HTML»
- Раздел «Текстовые»
- Раздел «Перекодировка и форматирование»
- Раздел «Проверка и сравнение»
- Раздел «Разное»
- Раздел «Функции массива»
- Раздел «Числовые»
- Раздел «Работа с переменными»
- Раздел «Листы и книги Excel»
- Раздел «Обработка файлов из папки»
- Раздел «HTTP запрос»
- Раздел «Internet Explorer»
- Раздел «Управление парсером»
- Раздел «Веб-запросы, XML, макросы VBA»
- Недокументированные действия
- Работа с браузером (Chrome и т.п.)
- Отключенные (устаревшие) действия
- Интерфейс программы
- Использование браузера
- Ошибки при парсинге
- Вывод массива значений в одну ячейку
- Обход защиты Qrator, Incapsula и CloudFare
- Ошибка: сервер не ответил за 9 секунд
- Парсер перезаписывает данные в первой строке листа
- Невозможно запустить макрос, - нет доступа к проекту VBA
- Ошибка Compile error in hidden module
- Ошибка загрузки страницы по HTTPS (SSL Error)
- Дополнительные возможности
- Зарезервированные переменные и подстановочные коды парсера
- Кеширование страниц в парсере
- Переменные в парсере
- Обновление строк в существующей таблице при парсинге
- Переключение между наборами настроек в парсере
- Запуск мониторинга цен по расписанию
- Запуск парсера по расписанию
- Программный запуск парсера из внешнего макроса
- Доп. опции парсера (файл parser.ini)
- Наборы действий
- Прочие статьи по настройке парсера
- Коды останова парсера, и перехода на другое действие
- Плагины для парсера
- Запуск нескольких парсеров по очереди
- Обработка капчи (Captcha) в парсере
- Прокси серверы
Режим «Брать данные с листа Excel из заданного столбца» |
В данном режиме парсер берет все непустые значения из указанного столбца (по умолчанию из столбца 1 "А"), начиная с указанной строки (по умолчанию — со второй строки).
Доступные опции:
Обрабатывать только выделенные строки
Если данная опция включена, то парсер будет обрабатывать только выделенные строки или строки, которые содержат выделенные ячейки.
Другими словами необязательно выделять строку целиком, достаточно выделить ячейки в одном столбце, причем необязательно в том, где находятся исходные данные.
Например на скриншоте мы выделили диапазон ячеек B5:B8. При включенном режиме "Обрабатывать только выделенные строки" и указанном столбце 1 "А", в качестве исходных данных у нас будет 4 ссылки из первого столбца.
Данную опцию удобно использовать для тестирования парсера, когда нет необходимости проверять все исходные данные, а нужно проверить только одну или несколько строк.
Брать отображаемый текст ячеек (а не значения)
Данная опция по умолчанию выключена, и парсер берет значение ячейки (а не отображаемый текст). Опция может понадобиться при использовании в ячейках нестандартных форматов отображения данных.
Например здесь в ячейке А1 отображается 000100, а значение ячейки равно 100 (что видно в строке формул выше). Это может быть почтовый индекс или артикул автомобильной запчасти. Если галка опции Брать отображаемый текст ячеек (а не значения) установлена, то из данной ячейки будет взята строка 000100, а если галка опции отключена (по умолчанию), то будет взято число 100.
В случае, если ячейка содержит гиперссылку, то значением для парсера считается именно гиперссылка, а не то, что отображается в ней. Смотрим пример.
Предположим, заданный столбец для парсера 2 "В". Если галка опции Брать отображаемый текст ячеек (а не значения) установлена, то из ячейки В2 будет взято число 2500. Если галка снята (значение по умолчанию), то будет взята гиперссылка.
Обрабатывать только строки, где значение столбца ... равно ...
При включении данной опции парсер берет в исходные значения только те строки, которые соответствуют заданному условию. Разберем на примере, как можно использовать данную опцию.
Для всех вариантов Исходные данные находятся в столбце 1 "А".
Вариант №1. Обрабатывать только строки, где значение столбца 1 "А" равно http*
Здесь мы выбрали для проверки тот же столбец, что является у нас исходным, и указали парсеру брать все строки, где значение начинается с http. Звездочка в данном случае обозначает любой символ. В качестве исходных данных будут взяты 9 ячеек со ссылками.
Вариант №2. Обрабатывать только строки, где значение столбца 2 "В" равно
Здесь мы будем сверяться по соседнему столбцу 2 "В". Поле правее слова "равно" мы оставили пустым. Т.е. парсер обрабатывает только те строки, где пустой столбец 2 "В". В качестве исходных данных будут взяты последние 6 строк, у которых пустой соседний столбец.
Данный вариант удобно использовать, когда надо обработать большой список значений в несколько заходов. Парсер после обработки ссылки может ставить в соседний столбец какую-нибудь метку. При повторном запуске мы прописываем условие как в данном варианте №2, и парсер будет обрабатывать только те строки, где метки не стоит.
Вариант №3. Обрабатывать только строки, где значение столбца 2 "В" равно ?*
В данном случае мы используем подстановочные символы. Звездочка, как мы знаем обозначает любой символ или отсутствие символов. Знак вопроса означает любой символ. Таким образом мы говорим парсеру обрабатывать строки, где в соседнем столбце 2 "В" есть хотя бы один символ (или больше). Будут обработаны только первые 5 строк (если мы начинаем со второй строки).
Еще один подстановочный символ, который можно использовать в поле правее слова "равно" - # - обозначает любую цифру.
Вариант №4. Обрабатывать только строки, где значение столбца 3 "С" равно шт
Для данного варианта свой пример таблицы (см. скриншот ниже). В поле правее слова "равно" можно вписывать любые значения с использованием подстановочных символов * ? # или без них. Указанный вариант №4 может быть использован, например, в прайсе, где вперемешку идут названия категорий и сами товары.
В данном примере будут обработаны только 10 строк, соответствующие условию.
- Добавить комментарий
- 2755 просмотров
Комментарии
В этом режиме, - пока никак. В следующих версиях данная возможность скорее всего появится (но не скоро)
Как работать с многопоточной загрузкой в этом режиме ?
Ответ есть в этой инструкции:
https://excelvba.ru/programmes/Parser/manuals/errors/overwriting
Подскажите, почему при рабочем настроенном парсере, при включении этой опции он может начать перезаписывать получаемые данные в одну строку. Т.е. при обмене идет смена данных в строке 2, сперва там появляются данные 1 товара, потом в этой же строке на их месте появляются данные товара 2, а не пишутся в строчку рядом с родительской ячейкой. Хотя код товара он берет и ищет по нему, но как-то странно выводит. Настройка вкладки такая же как у вас на фото.