Надстройка Parser для MS Excel: общие сведения
Предназначение программы: быстрый сбор любых данных с различных сайтов или файлов, с выводом результата в Excel.
Основные возможности:
- парсинг интернет-магазинов и любых других сайтов (соцсетей, каталогов, объявлений и т.д.)
- извлечение данных из файлов формата Word / Excel / txt / PDF
- скачивание файлов (изображений, документов, и т.п.)
- обновление цен по ссылкам (мониторинг цен конкурентов / РРЦ)
Особенности программы
Простота использования и настройки
- Запуск парсера нажатием одной кнопки на ленте Excel
- Для настройки парсеров не нужно знание программирования!
Достаточно минимально понимать HTML (что такое теги), и изучить 2 основные команды парсера (загрузка страницы, и поиск тегов). Этого достаточно для 90% задач. - Если сами не разберётесь с настройкой — всегда можно заказать нам настройку парсера под вашу задачу.
- Всё что нужно для работы парсера, это Windows 10 (или новее) и Microsoft Excel (версии 2010 или новее)
Иногда ещё нужен браузер Google Chrome (для работы с проблемными сайтами) - Можно настроить программу под несколько разных сайтов (задач), и легко переключаться между настройками через выпадающий список на панели инструментов программы.
Гибкая постобработка данных
- Множество текстовых функций для обработки полученной информации
- Разнообразные фильтры и функции перекодировки
- Работа с переменными и массивами данных
- Разбиение значений на отдельные элементы с индивидуальной обработкой
- Автоматический вывод характеристик товаров в отдельные столбцы
- Интеллектуальный поиск цен на страницах
- Поддержка форматов JSON и XML
Продвинутые сетевые возможности
- Несколько способов загрузки страниц — WinHTTP / WinAPI / WinINET / IE / Google Chrome
- Авторизация — поддержка входа в аккаунты на различных сайтах
- Региональные настройки — выбор географического региона для парсинга
- HTTP-запросы — поддержка GET и POST методов, конструктор запросов
- Cookies и Headers — полная работа с HTTP-заголовками и куки
- Многопоточность — до 200 одновременных потоков для ускорения работы
- Обход защиты — распознавание капчи через сервис RuCaptcha.com, паузы между запросами
- Браузерная интеграция — работа с защищёнными от роботов сайтами через Google Chrome
- Кеширование — сохранение данных для повторного использования
Неограниченные возможности поиска и навигации по сайту
- Рекурсивный поиск страниц на сайтах
- Поиск данных по HTML-тегам и их атрибутам
- Автоматическое обнаружение ссылок пагинации (пейджера)
- Специализированные функции для работы с HTML-таблицами
- Преобразование HTML в текст и пары "название-значение"
- Очистка HTML от лишних данных
Интеграция с Excel
- Чтение данных из файлов Excel для использования в парсинге
- Создание отдельных листов и файлов
- Динамическое формирование столбцов для вывода результатов
- Использование всех встроенных возможностей Excel (условное форматирование, формат ячеек)
- Удобная панель инструментов для запуска парсинга
Работа с файлами
- Сбор данных из файлов различных форматов (Word, XML, TXT, Excel, PDF)
- Обработка файлов из заданных пользователем папок
- Сохранение изображений и документов под заданными именами в настраиваемые папки
С момента выхода программы в 2014 году, её функционал постоянно развивался (вышли сотни обновлений), поэтому сейчас в парсере есть всё, что только может вам понадобиться для сбора данных из интернета.
Более подробно всё это описано в разделе Справка по программе
Дополнительные видео и подробное описание функционала можно найти в разделе Справка по программе
В программе можно настроить несколько парсеров (обработчиков сайтов).
Любой из парсеров настраивается и работает независимо от других.
Примеры настроенных парсеров (можно скачать, запустить, посмотреть настройки)
Видеоинструкция (2 минуты), как запустить готовый (уже настроенный) парсер
Если вам нужен готовый парсер, но вы не хотите разбираться с настройкой,
— закажите настройку парсера разработчику программы. Стоимость настройки под конкретный сайт - от 2500 рублей.
Настройка под заказ выполняется только при условии приобретения лицензии на надстройку «Парсер» (4000 руб)
Инструкция (с видео) по заказу настройки парсера
По всем вопросам, связанным с заказом, готов проконсультировать вас в Телеграм.
Комментарии
Игорь, подскажите пожалуйста, как можно избавиться (точнее, корректно сконвертировать в текстовый вид) от "специальных символов HTML" получаемых в большом количестве при загрузке страницы? Какие есть вариант(ы)? А то всё в перемешку, и нормальный текст, с кавычками и дефисами и прочими знаками и вот примерно с таким видом: https://i.imgur.com/XxfQwyh.png
Александр, такого тоже нет.
Команду закрытия эксель тоже могу добавить, но доработка будет платной (другие пользователи о таком не просили)
В скрытом режиме теоретически можно, но делать подобное не планирую (теряется возможность контролировать процесс и прерывать его)
Игорь, если честно, был на 100% уверен, что такая функция имеется и просто не могу ее найти. Был бы вам весьма благодарен, за добавление возможности запускать внешние файлы по событию! И, что-бы как говорится "два раза не вставать"... подскажите, а возможно не просто "Закрыть книгу Excel", а закрыть Excel полностью? А то автоматические процессы заканчиваются, а Excel висит себе открытым... И ещё вопрос, существует ли возможность работы Excel с запущенным парсером в скрытом (невидимом? фоновом?) режиме?
Александр, такой возможности нет, но могу добавить в следующих версиях программы.
Подскажите пожалуйста, как можно после завершения работы парсера дать команду на запуска bat или exe файла?
Здравствуйте, Ольга.
Да, конечно можно.
Высылайте заказ на парсер в таком виде:
https://excelvba.ru/programmes/Parser/order
Будет заказ - будет информация о стоимости.
Добрый день! Рассматриваем приобретение Вашей надстройки Парсер. Скажите, пожалуйста, перед приобретением программы, можно Вам выслать ТЗ, чтобы Вы ответили, сможете сделать такую настройку для нас или нет. Сколько у Вас стоит настройка Парсера под определенную задачу? Спасибо!
Я не имею возможности консультировать по вопросам настройки.
Можем настроить под заказ.
По первому вопросу: посмотрите вторую видеоинструкцию, там как раз про это:
https://excelvba.ru/programmes/Parser/manuals/Loading_Pages_and_Logon
Очень нравится ваша программа, но из-за собственных слабых познаний затрудняюсь в использование. Покажите пожалуйста, как перейти по вкладкам на сайте, если они исполнены как "< l i data-block="summary" data - ajax="summary/"> Результаты
". Или как добавить к ссылке полученной через "Преобразование в гиперссылку" текст, чтобы исходных код страницы брался с "гиперсылка"+"то что я добавил". Спасибо)
Здравствуйте, Дмитрий
Напишите мне в скайп, решим проблему.
Добрый день!
В последнее время на одном из компьютеров стало очень долго открываться окно настроек Парсера. Также очень много времени требуется для сохранения даже самых незначительных изменений. Также сам процесс парсинга данных занимает в разы больше времени, чем это было до возникновения данной проблемы. На другой машине таких проблем не возникает.
Прошу подсказать, с чем могут быть связаны такие подтормаживания надстройки? Сам Excel, ровно как и Windows, не тормозят ни капли. Машина мощная. Судя по графикам, процессор грузится в моменты открытия и внесения изменений в настройки приблизительно на 30%.
Очень надеюсь на Ваш совет, т.к. подобное поведение надстройки вызывает существенные трудности при её эксплуатации.
Теоретически возможно, конечно, но я версию под Mac делать не буду.
Мои программы работают только под Windows
Здравствуйте. А можно ли сделать такой парсер для MS EXEl под mac и если да, сколько это будет стоить?
Если сделаете пример результата в Экселе, то можно
Добрый день! Есть ли возможность парсинга части таблицы из word в excel с сохранением разметки?
В действии «Поиск тегов» первым параметром указываете div, а четвертым data-brand
Здравствуйте, как из такого div взять data-brand?
div class="col-sm-3 col-xs-6 brand" style="text-align: center; padding-bottom: 15px;" data-brand="110"
Если это ваш сайт, то вы и без парсера можете выгрузить эти данные из админки.
Если это не ваш сайт, то эти данные получить невозможно.
Привет. Нужны дааные которые пользователи вводят при регистрации на сайте в специальной форме, это можно сделать с помощью вашей программы или надо заказывать настройку такого парсинга отдельно?
Антон, парсер может обработать и такие ссылки, просто настройка немного другая
(так как в парсере не работает javascript, надо смотреть, какие запросы выполняет браузер, и делать аналогично)
Можем настроить под заказ.
Приветствую. На многих сайтах ссылки (особенно паджинатора) прописаны яваскриптом. Имею в виду конструкции вида | href="#" onClick="getURL(/cat/tov.html);" | Пробовал разные настройки, парсер их не видит. Я что-то упускаю или парсер рассчитан исключительно на plain html?
Сделать можем, если вы вышлете задание (с какого сайта и откуда конкретно эти данные брать)
Друзья, часто нужны контакты (телефоны) ИП из разных регионов РФ.
Есть ли у кого-то готовый парсер на такой случай или может ли кто-то сделать его за гонорар?
Можем настроить под заказ.
Заказы на парсер принимаются в таком виде
https://excelvba.ru/programmes/Parser/order
Добрый день,я просто пока не могу понять, что для этого нужно выбрать, как сделать значение в отдельном столбце понятно, но тогда будет сильно растянутая таблица, а вот что каждое значение в отдельной строке (как новое) не понятно(((((
Татьяна, да, конечно можно.
Добрый день, подскажите можно ли в отдельные строки выводить товаров с таблицы товара (одно наименование, разные характеристики-модели). Вот страница для примера https://www.sss.by/prod/mebel-dlya-vannoi-komnaty/umby-pod-umyvalnik/umb...
В действии «Получить все ссылки пейджера» в параметре «Дополнительные параметры» напишите step=1
пейджер отображает только четные страницы http://opt.ros-decor.ru/category/photoshtori/tsvety/
не могу разобраться, помогите
Игорь, какая примерно цена по настройке парсера?