Надстройка Parser для MS Excel: общие сведения
Предназначение программы: быстрый сбор любых данных с различных сайтов или файлов, с выводом результата в Excel.
Основные возможности:
- парсинг интернет-магазинов и любых других сайтов (соцсетей, каталогов, объявлений и т.д.)
- извлечение данных из файлов формата Word / Excel / txt / PDF
- скачивание файлов (изображений, документов, и т.п.)
- обновление цен по ссылкам (мониторинг цен конкурентов / РРЦ)
Особенности программы
Простота использования и настройки
- Запуск парсера нажатием одной кнопки на ленте Excel
- Для настройки парсеров не нужно знание программирования!
Достаточно минимально понимать HTML (что такое теги), и изучить 2 основные команды парсера (загрузка страницы, и поиск тегов). Этого достаточно для 90% задач. - Если сами не разберётесь с настройкой — всегда можно заказать нам настройку парсера под вашу задачу.
- Всё что нужно для работы парсера, это Windows 10 (или новее) и Microsoft Excel (версии 2010 или новее)
Иногда ещё нужен браузер Google Chrome (для работы с проблемными сайтами) - Можно настроить программу под несколько разных сайтов (задач), и легко переключаться между настройками через выпадающий список на панели инструментов программы.
Гибкая постобработка данных
- Множество текстовых функций для обработки полученной информации
- Разнообразные фильтры и функции перекодировки
- Работа с переменными и массивами данных
- Разбиение значений на отдельные элементы с индивидуальной обработкой
- Автоматический вывод характеристик товаров в отдельные столбцы
- Интеллектуальный поиск цен на страницах
- Поддержка форматов JSON и XML
Продвинутые сетевые возможности
- Несколько способов загрузки страниц — WinHTTP / WinAPI / WinINET / IE / Google Chrome
- Авторизация — поддержка входа в аккаунты на различных сайтах
- Региональные настройки — выбор географического региона для парсинга
- HTTP-запросы — поддержка GET и POST методов, конструктор запросов
- Cookies и Headers — полная работа с HTTP-заголовками и куки
- Многопоточность — до 200 одновременных потоков для ускорения работы
- Обход защиты — распознавание капчи через сервис RuCaptcha.com, паузы между запросами
- Браузерная интеграция — работа с защищёнными от роботов сайтами через Google Chrome
- Кеширование — сохранение данных для повторного использования
Неограниченные возможности поиска и навигации по сайту
- Рекурсивный поиск страниц на сайтах
- Поиск данных по HTML-тегам и их атрибутам
- Автоматическое обнаружение ссылок пагинации (пейджера)
- Специализированные функции для работы с HTML-таблицами
- Преобразование HTML в текст и пары "название-значение"
- Очистка HTML от лишних данных
Интеграция с Excel
- Чтение данных из файлов Excel для использования в парсинге
- Создание отдельных листов и файлов
- Динамическое формирование столбцов для вывода результатов
- Использование всех встроенных возможностей Excel (условное форматирование, формат ячеек)
- Удобная панель инструментов для запуска парсинга
Работа с файлами
- Сбор данных из файлов различных форматов (Word, XML, TXT, Excel, PDF)
- Обработка файлов из заданных пользователем папок
- Сохранение изображений и документов под заданными именами в настраиваемые папки
С момента выхода программы в 2014 году, её функционал постоянно развивался (вышли сотни обновлений), поэтому сейчас в парсере есть всё, что только может вам понадобиться для сбора данных из интернета.
Более подробно всё это описано в разделе Справка по программе
Дополнительные видео и подробное описание функционала можно найти в разделе Справка по программе
В программе можно настроить несколько парсеров (обработчиков сайтов).
Любой из парсеров настраивается и работает независимо от других.
Примеры настроенных парсеров (можно скачать, запустить, посмотреть настройки)
Видеоинструкция (2 минуты), как запустить готовый (уже настроенный) парсер
Если вам нужен готовый парсер, но вы не хотите разбираться с настройкой,
— закажите настройку парсера разработчику программы. Стоимость настройки под конкретный сайт - от 2500 рублей.
Настройка под заказ выполняется только при условии приобретения лицензии на надстройку «Парсер» (4000 руб)
Инструкция (с видео) по заказу настройки парсера
По всем вопросам, связанным с заказом, готов проконсультировать вас в Телеграм.
Комментарии
Спасибо. РАЗОБРАЛАСЬ!!! Получилось.
Анастасия, видимо, что-то не так у вас настроено
Позвоните в скайп, - подскажу, что исправить.
никак не могу разобраться с Вашим парсером.
Вроде парсит, заполняет столбцы в эксель, а куда потом это все девается?
По окончании работы парсера все исчезает - пустое окно экселя (как до запуска парсинга)
Здравствуйте,
подскажите пжта. Можно ли с определенного сайта (сайта поставщика) выдернуть товары в наличии (описания, картинки и т.д.) и автоматом залить в мой магазин?
Здравствуйте, Пётр
Да, возможно.
Самый простой вариант, - вы делаете и продаёте настройки парсера, - а программу покупают у меня.
И вам, и мне, это будет выгодно.
Возможны и другие варианты, - напишите мне в личку, обсудим.
Отличный инструмент!
Сделал простой работающий парсер для сайта Инфостарт.рф
Огромное спасибо за ваш труд!
У меня вопрос - возможно ли коммерческое использование вашей программы?
Я хочу создавать свои алгоритмы парсинга сайтов и предлагать их на своем сайте.
Продаете ли вы ограниченные или неограниченные права на использование?
Жду вашего ответа в почту.
Заранее спасибо!
Как по мне, лучший парсер здесь: http://excelvba.ru/. Сам приобрел и не парюсь уже довольно долгое время, чего и вам советую.
Классно!!! Превосходно!! +
отличный парсер. спасибо вам
Здравствуйте, Евгений.
Такого рода консультации, - только голосом, по скайпу
Звоните в скайп после 30 мая, - я подключусь к вашему компу, и покажу, что как сделать
Доброй ночи )
Впервые набрёл на вашу прелесть.
В целом всё понятно, только вот в одном из вариантов парсинга почему-то не удаётся вывести элементы массива по столбцам, хотя галочка стоит и в тестовом режиме все значения массива разбираются по строкам.
В чём моя ошибка?
Кроме того, попытка вывода отдельных данных по столбцам потерпела крах.
Поясните пожалуйста логику работы:
Для каждого столбца берутся данные парсинга исходных данных и с ними можно работать неоднократно или после фильтра первого столбца второму достаются только эти крохи?
Попробуйте другим браузером скачать, - всё должно получиться.
Если бы файл действительно не скачивался, - мне бы уже десятки людей написали об ошибке.
При скачивании пробной версии, отображается:
Данные не получены
ERR_EMPTY_RESPONSE
Здравствуйте, Александр
Сделать это возможно (собственно, программа для таких задач и сделана), но ничего конкретного посоветовать не могу, - от сайта зависит
(даже если бы я вам написал инструкцию для какого-то одного сайта, - она не подошла бы к другому сайту)
Можем настроить под заказ, от вас для этого надо:
http://excelvba.ru/programmes/Parser/order
Здравствуйте,
Скажите, возвожно ли сделать так, что бы ексель открывал сайт https, вводил в определенное поле номер из таблицы, а после копировал определенные данные с сайта в таблицу?
Если Да, то как это делать?
Ps: Спасибо за программу, похоже что именно то, что нужно,вот только бы понять как работает.
Здравствуйте, Олег
Да, конечно, - собственно, для того парсер и разрабатывался.
Можем выполнить настройку под заказ,
от вас для этого надо: http://excelvba.ru/programmes/Parser/order
Здравствуйте.
Подскажите пожалуйста, может ли парсер просмотреть каталог товаров и спарсить данные.
Я имею ввиду, что у меня нет ссылок товаров, но есть ссылка на каталог.
9 мая 2015 г. в 12:58 стало доступно обновление программы «Parser» (версия 1.1.6).
Изменения в новой версии программы:
Рекомендуем обновить программу до последней версии!
3 мая 2015 г. в 18:10 стало доступно обновление программы «Parser» (версия 1.1.5).
Изменения в новой версии программы:
Рекомендуем обновить программу до последней версии!
1. Да, получение списка товаров выполняется во вкладке "исходные данные"
2. Через переменную. Получили значение 74, записали его в переменную count,
а потом в параметре «максимальное значение» действия «создать массив значений для цикла»
пишем %count% (таким образом будет считано значение переменной)
Если какие вопросы еще будут, - обращайтесь в скайп, подскажу.
Спасибо за оперативный ответ!
Возникла еще пара вопросов:
1. Действия выполняем на вкладке исходные данные?
2. Как в примере (шаг 2) передать значение 74 в качестве параметра цикла?
По сайту юлмарт, - там можно выводить товары постранично
Если к ссылке на страницу товаров какой-то категории добавить &pageNum=2
то выведутся товары с 31 по 60-й.
Как бы настраивал я:
1) запоминаем ссылку на категорию товара в переменную (например, с именем URL)
2) прогружаем эту страницу с товарами, ищем там текст вида «Показано товаров 30 из 74»
<span id="max-show-count">74</span>
Т.е. после загрузки страницы, выполняем поиск элемента по ID = max-show-count,
получая значение 54
2) формируем цикл от 1 до найденного значения (74), указав делитель 30
Получаем массив из трёх чисел: 1, 2, 3
3) Действие «Добавить текст до или после», добавляем ДО значения %URL%&pageNum=
в результате, получаем массив из 3 ссылок:
4) действие «загрузить исходный код веб-страницы»
на выходе имеем массив из 3 загруженных страниц
Далее обрабатываем как обычно (поиск тегов a класса js-gtm-product-click — получаем 74 ссылки на товары)
Доброго дня!
Спасибо за скрипт!
Подскажите на сайте юлмарт, как можно получить полный список продукции, если там используется комбинация "показать еще 30"?
Никаких «шагов назад» тут делать не нужно.
Могу показать, как правильно настроить.
От вас для этого нужно: http://ExcelVBA.ru/help
Здравствуйте! Подскажите, как организовать действие перехода на следующую страницу каталога?
например: http://xn--l1aeaei6b.xn--p1ai/magazin/folder/14043406
Т.е. я через вкладку исходные данные я нахожу все каталоги - далее подкаталоги и т.д. пока недобирусь до подкаталогов с товаром. собираю массив ссылк на товары и с каждым элементом этого массива производим наборы действий из вкладки вывод на лист.
И вот тут у меня затупка, т.к. сайт не позволяет вывести все товары каталога на лист и мне нужно заставить парсер сделать шаг назад. прейдя на страницу №2 опять собирать массив ссылк на товары.
Накрутил, конечно! Надеюсь поймете суть вопроса! Спасибо
Да, функция перевода перестала работать (так как она задействует переводчик гугл - видимо, гугл что-то поменял там у себя)
Постараюсь починить, если кто-то из покупателей программы попросит (я эту возможность делал «на всякий случай», переделывать долго)
Попробовал переводить на другой язык, но получаю пустое значение не зависимо с какого на какой переводить. Пробовал так: "Задать новое значение" указываю простое слово например "sky" язык перевода "ru" результат "пустое значение". Не работает?
Здравствуйте, Максим.
Установленные браузеры к моему парсеру отношения не имеют
Парсер использует компоненты Windows для подключения к сайтам.
Есть 2 варианта работы с сайтом с авторизацией:
Способ 1 — рекомендуемый, но сложный: настроить авторизацию в моём парсере
пример описан здесь: http://excelvba.ru/programmes/Parser/manuals/Authentication
Способ 2 — простой, но глючный: авторизоваться вручную в Internet Explorer,
и, вместо действий типа «Загрузить исходный код веб-страницы»,
везде применять действие «Открыть веб-страницу в Internet Explorer».
Проблема тут в том, что IE, при программной работе с ним, частенько подвисает.
Добрый день!
скажите пожалуйста как быть с сайтом, где нужна авторизация? я залогинился во всех 3х бреузерах установленных у меня, но через парсер страница всё равно открывается "без залогинивания"
если что - вот ссылка http://rev-online.biz/view.php?view=1
Огромная благодарность автору за программу и отношение, превосходный функционал, если разобраться в ней она не уступает аналогам ( где тоже собственно, надо разбираться). А самое главное отношение автора, оперативно помог, доступно объяснил и сделал даже более, чем я мог предполагать!!!!
Здравствуйте, Армен
Позвоните мне в скайп, - подскажу, что исправить в настройках.