Надстройка Parser для MS Excel: общие сведения
Предназначение программы: быстрый сбор любых данных с различных сайтов или файлов, с выводом результата в Excel.
Основные возможности:
- парсинг интернет-магазинов и любых других сайтов (соцсетей, каталогов, объявлений и т.д.)
- извлечение данных из файлов формата Word / Excel / txt / PDF
- скачивание файлов (изображений, документов, и т.п.)
- обновление цен по ссылкам (мониторинг цен конкурентов / РРЦ)
Особенности программы
Простота использования и настройки
- Запуск парсера нажатием одной кнопки на ленте Excel
- Для настройки парсеров не нужно знание программирования!
Достаточно минимально понимать HTML (что такое теги), и изучить 2 основные команды парсера (загрузка страницы, и поиск тегов). Этого достаточно для 90% задач. - Если сами не разберётесь с настройкой — всегда можно заказать нам настройку парсера под вашу задачу.
- Всё что нужно для работы парсера, это Windows 10 (или новее) и Microsoft Excel (версии 2010 или новее)
Иногда ещё нужен браузер Google Chrome (для работы с проблемными сайтами) - Можно настроить программу под несколько разных сайтов (задач), и легко переключаться между настройками через выпадающий список на панели инструментов программы.
Гибкая постобработка данных
- Множество текстовых функций для обработки полученной информации
- Разнообразные фильтры и функции перекодировки
- Работа с переменными и массивами данных
- Разбиение значений на отдельные элементы с индивидуальной обработкой
- Автоматический вывод характеристик товаров в отдельные столбцы
- Интеллектуальный поиск цен на страницах
- Поддержка форматов JSON и XML
Продвинутые сетевые возможности
- Несколько способов загрузки страниц — WinHTTP / WinAPI / WinINET / IE / Google Chrome
- Авторизация — поддержка входа в аккаунты на различных сайтах
- Региональные настройки — выбор географического региона для парсинга
- HTTP-запросы — поддержка GET и POST методов, конструктор запросов
- Cookies и Headers — полная работа с HTTP-заголовками и куки
- Многопоточность — до 200 одновременных потоков для ускорения работы
- Обход защиты — распознавание капчи через сервис RuCaptcha.com, паузы между запросами
- Браузерная интеграция — работа с защищёнными от роботов сайтами через Google Chrome
- Кеширование — сохранение данных для повторного использования
Неограниченные возможности поиска и навигации по сайту
- Рекурсивный поиск страниц на сайтах
- Поиск данных по HTML-тегам и их атрибутам
- Автоматическое обнаружение ссылок пагинации (пейджера)
- Специализированные функции для работы с HTML-таблицами
- Преобразование HTML в текст и пары "название-значение"
- Очистка HTML от лишних данных
Интеграция с Excel
- Чтение данных из файлов Excel для использования в парсинге
- Создание отдельных листов и файлов
- Динамическое формирование столбцов для вывода результатов
- Использование всех встроенных возможностей Excel (условное форматирование, формат ячеек)
- Удобная панель инструментов для запуска парсинга
Работа с файлами
- Сбор данных из файлов различных форматов (Word, XML, TXT, Excel, PDF)
- Обработка файлов из заданных пользователем папок
- Сохранение изображений и документов под заданными именами в настраиваемые папки
С момента выхода программы в 2014 году, её функционал постоянно развивался (вышли сотни обновлений), поэтому сейчас в парсере есть всё, что только может вам понадобиться для сбора данных из интернета.
Более подробно всё это описано в разделе Справка по программе
Дополнительные видео и подробное описание функционала можно найти в разделе Справка по программе
В программе можно настроить несколько парсеров (обработчиков сайтов).
Любой из парсеров настраивается и работает независимо от других.
Примеры настроенных парсеров (можно скачать, запустить, посмотреть настройки)
Видеоинструкция (2 минуты), как запустить готовый (уже настроенный) парсер
Если вам нужен готовый парсер, но вы не хотите разбираться с настройкой,
— закажите настройку парсера разработчику программы. Стоимость настройки под конкретный сайт - от 2500 рублей.
Настройка под заказ выполняется только при условии приобретения лицензии на надстройку «Парсер» (4000 руб)
Инструкция (с видео) по заказу настройки парсера
По всем вопросам, связанным с заказом, готов проконсультировать вас в Телеграм.
Комментарии
Добрый день! Подскажите, как восстановить работоспособность парсера - старые надстройки работают, но нет возможности ни редактирования, ни создания новых (в окне настройки - внизу красным шрифтом сообщение "Настройки этого парсера недоступны для редактирования"). Спасибо.
Если считаете, что такое можно сделать, - сделайте, кучу денег заработаете)
Парсер работает с любыми сайтами, независимо от того, работает сайт в IE или не работает (никакой тут связи нет)
PS: Я «на слабо» не ведусь)
Если бы такое можно было сделать (чтобы без настройки любой сайт парсился) - конечно бы сделал. Но это нереально.
Добрый день, а почему бы не сделать универсальный парсер, без настройки за 400руб, а с настройкой под самого глупого юзера? )) неужели такому крутому и слабо?) и наверное парсер нормально работает только на тех сайтах, которые можно открыть с помощью IE и вероятно не в 2013, 16 офисе
Добрый день.
Когда Вам удобно будет связаться по скайпу для помощи в написании парсера?
Стандартный вариант заказа не подходит так как необходимо получать данный после авторизации.
Я написал Вам в скайпе.
Алекс, напишите мне в скайп, решим проблему.
Ник в скайпе: ExcelVBA.ru
(версия 2.4.0 от 10.10.2016) виснет наглухо при попытке открыть любой набор на действий или уровень на редактирование
Нет ли возможности отключить проверку обновлений? Антивирус постоянно ругается а последняя версия не работает. Нашел копию 2.2.2 работаю с ней
Здравствуйте, Алексей.
Да, можно
заказы на парсер принимаются в таком виде
http://excelvba.ru/programmes/Parser/order
Возможно ли с помощью Вашей программы собрать объявления например с сайта http://tambov.barahla.net/realty/218/?page=4? Меня интересует несколько параметров:текст объявления, цена, площадь, дата, ссылка на конкретное объявление, ну и еще несколько.
Для удаления, нажмите О программе - Опции - Удалить программу
Здравствуйте, каким образом полностью удалить программу с компьютера?
Вадим, ответ на ваш вопрос есть здесь: http://excelvba.ru/faq/virus
Здравствуйте, почему то антивирус ругаться стал на парсер. пишет что троян. (windows defender)
например, действием ЗАДАТЬ НОВОЕ ЗНАЧЕНИЕ
с параметром %переменная1% %переменная2%
PS: есть и другие способы (например, действие «добавить текст до или после»)
Здравствуйте! как в парсере объединить данные из двух переменных, которые были записаны шагами ранее? Какая последовательность команд при этом должна быть?
Так (без предупреждения, автоматически) устанавливаются только критические обновления (которые бывают очень редко)
Программа сама обновляется. Галка устанавливать обновления автоматически не стоит.
Анатолий, если готовы приобрести программу-парсер (2500 руб), и оплатить перенастройку парсера (от 500 руб), - то сделаю, пишите мне в скайп, обсудим, что и как там должно в парсере работать.
Я посмотрел через TimeMachine на сайт магнита, вроде бы структура осталась та же... просто блоки с регионами местами переставлены, но парсер в примере не работает. Вы можете подправить настройки парсера в Вашем примере на этом сайте? Пожалуйста, буду безгранично благодарен!
Анатолий, да, там сайт поменялся, - потому и не работает.
Нашел ответ сам.
Игнорируйте мой вопрос.
СпасибО!
Добрый день.
Файл с примером парсера сайта magnit не работает, структура сайта изменилась или я что-то не так делаю?
Спасибо за ответ.
Добрый день.
Туплю со стандартным вопросом но не могу найти решение сам.
Есть страница магазина с 10 ссылками на товары.
Ищу ссылки при помощи поиска тегов, получаю массив ссылок.
Могу вывести массив отдельно в столбцы (при помощи галочки)
А как вывести их отдельно в строки?
Копался, смотрел примеры, но не нашел...
Спасибо!
Во окне "Маска для проверки на соответствие" указать %ваша переменная%
Не происходит обновления с версии 2.3.0 до 2.3.1 пришлось качать с сайта.
Ответ есть здесь:
http://excelvba.ru/faq/virus
Качаю файл Parser.xla (версия 2.2.4 от 07.09.2016) АВАСТ выдает предупреждение. ТРОЯН. Что делать подскажите
Дмитрий, почти с любого сайта парсер может взять данные
(но только если сайт работает. указанный вами сайт у меня не открывается)
Игорь, а можно ли данные к примеру с parimatch.com переносить в excel? И вообще может есть ограничения какие-то конкретные?
Здравствуйте, Алексей.
Да, получится, если на этих сайтах нет капчи и прочих скрытых защит.
Сайт yell.com не работает
заказы на парсер принимаются в таком виде
http://excelvba.ru/programmes/Parser/order
Подскажите пожалуйста получиться ли с помощью вашего парсера получать данные с yell.com, goldenpages.be, www.meinestadt.de ?