Надстройка Parser для MS Excel: общие сведения
Предназначение программы: быстрый сбор любых данных с различных сайтов или файлов, с выводом результата в Excel.
Основные возможности:
- парсинг интернет-магазинов и любых других сайтов (соцсетей, каталогов, объявлений и т.д.)
- извлечение данных из файлов формата Word / Excel / txt / PDF
- скачивание файлов (изображений, документов, и т.п.)
- обновление цен по ссылкам (мониторинг цен конкурентов / РРЦ)
Особенности программы
Простота использования и настройки
- Запуск парсера нажатием одной кнопки на ленте Excel
- Для настройки парсеров не нужно знание программирования!
Достаточно минимально понимать HTML (что такое теги), и изучить 2 основные команды парсера (загрузка страницы, и поиск тегов). Этого достаточно для 90% задач. - Если сами не разберётесь с настройкой — всегда можно заказать нам настройку парсера под вашу задачу.
- Всё что нужно для работы парсера, это Windows 10 (или новее) и Microsoft Excel (версии 2010 или новее)
Иногда ещё нужен браузер Google Chrome (для работы с проблемными сайтами) - Можно настроить программу под несколько разных сайтов (задач), и легко переключаться между настройками через выпадающий список на панели инструментов программы.
Гибкая постобработка данных
- Множество текстовых функций для обработки полученной информации
- Разнообразные фильтры и функции перекодировки
- Работа с переменными и массивами данных
- Разбиение значений на отдельные элементы с индивидуальной обработкой
- Автоматический вывод характеристик товаров в отдельные столбцы
- Интеллектуальный поиск цен на страницах
- Поддержка форматов JSON и XML
Продвинутые сетевые возможности
- Несколько способов загрузки страниц — WinHTTP / WinAPI / WinINET / IE / Google Chrome
- Авторизация — поддержка входа в аккаунты на различных сайтах
- Региональные настройки — выбор географического региона для парсинга
- HTTP-запросы — поддержка GET и POST методов, конструктор запросов
- Cookies и Headers — полная работа с HTTP-заголовками и куки
- Многопоточность — до 200 одновременных потоков для ускорения работы
- Обход защиты — распознавание капчи через сервис RuCaptcha.com, паузы между запросами
- Браузерная интеграция — работа с защищёнными от роботов сайтами через Google Chrome
- Кеширование — сохранение данных для повторного использования
Неограниченные возможности поиска и навигации по сайту
- Рекурсивный поиск страниц на сайтах
- Поиск данных по HTML-тегам и их атрибутам
- Автоматическое обнаружение ссылок пагинации (пейджера)
- Специализированные функции для работы с HTML-таблицами
- Преобразование HTML в текст и пары "название-значение"
- Очистка HTML от лишних данных
Интеграция с Excel
- Чтение данных из файлов Excel для использования в парсинге
- Создание отдельных листов и файлов
- Динамическое формирование столбцов для вывода результатов
- Использование всех встроенных возможностей Excel (условное форматирование, формат ячеек)
- Удобная панель инструментов для запуска парсинга
Работа с файлами
- Сбор данных из файлов различных форматов (Word, XML, TXT, Excel, PDF)
- Обработка файлов из заданных пользователем папок
- Сохранение изображений и документов под заданными именами в настраиваемые папки
С момента выхода программы в 2014 году, её функционал постоянно развивался (вышли сотни обновлений), поэтому сейчас в парсере есть всё, что только может вам понадобиться для сбора данных из интернета.
Более подробно всё это описано в разделе Справка по программе
Дополнительные видео и подробное описание функционала можно найти в разделе Справка по программе
В программе можно настроить несколько парсеров (обработчиков сайтов).
Любой из парсеров настраивается и работает независимо от других.
Примеры настроенных парсеров (можно скачать, запустить, посмотреть настройки)
Видеоинструкция (2 минуты), как запустить готовый (уже настроенный) парсер
Если вам нужен готовый парсер, но вы не хотите разбираться с настройкой,
— закажите настройку парсера разработчику программы. Стоимость настройки под конкретный сайт - от 2500 рублей.
Настройка под заказ выполняется только при условии приобретения лицензии на надстройку «Парсер» (4000 руб)
Инструкция (с видео) по заказу настройки парсера
По всем вопросам, связанным с заказом, готов проконсультировать вас в Телеграм.
Комментарии
Привет. у меня есть список имен файлов которые нужно выделить из большого количества файлов. Попробовал ваш парсер, он находит их расположение, массив из адресов необходимых файлов, но вот как его заставить скачать данные файлы с диска компьютера, какой командой
Здравствуйте, Владислав.
Да, реализуемо (делал подобное)
заказы на парсер принимаются в таком виде
http://excelvba.ru/programmes/Parser/order
После ознакомления с заказом, - озвучу стоимость
Интересует парсинг комментариев к фото вконтакте. Это реализуемо? Сколько будет стоить?
Здравствуйте, Вячеслав.
Нет, не будет. Ни эта версия, ни последующие версии.
На маке, - можно пользоваться под Parallels (в Windows)
Доброго времени суток,
Будет ли данная программа работать в MS Exel под Mac?
Заранее спасибо!
Добрый день, Андрей! Да, может и YML, и xml, и текстовые файлы, и даже файлы doc (Ворд). Если интересует, вот здесь указаны требования к оформлению заказа: http://excelvba.ru/programmes/Parser/order
Привет, а парсер может парсить YML?
Спасибо.
Активация прошла
Здравствуйте, Михаил.
Новая версия (2.x.x) - на новом движке, обновление не сработает.
Надо вручную скачать новую версию с сайта, и заменить старый файл надстройки новым.
Насчёт активации, - всё получится (сбросил ваши активации старой версии)
Здравствуйте, Игорь.
У меня парсер не видит обновления выше своей версии (1.2.6)
При скачивании и установки версии 2.0.х сообщает что вы израсходовали все лицензии.
Здравствуйте, Tidus
Можно и готовую выгрузку заказать, - но дешевле не будет, - т.к. парсер все равно надо настраивать, да еще потом и ждать пока все скачается (комп разработчика будет занят длительное время)
Добрый день
Хотелось бы уточнить, можно ли заказать саму информацию с сайта. Так как сам парсер мне не нужен, нужна только база объявлений с сайта kolesa.kz/ Krisha.kz для анализа изменения цен для дипломной работы. Если да, то сколько будет стоить 2 сайта вместе и каждый в отдельности.
Ваш е-мейл принудительно отписали от рассылки. Почему не работает ссылка отписки (и сработала ли "принудительная" отписка), будем разбираться.
Ваш комментарий я отредактировал и впредь попрошу не выражаться матом, особенно по отношению к другим людям.
по паре писем проходил и жал ссылку отписаться но спам продолжает идти
Можете объяснить почему моя почта засыпается тысячей уведомлений о том что какие то люди оставили на этом сайте коментарий? Я сделал всего один вопрос - вы ответили - я получил хорроший ответ. Но зачем мне приходят уведомления о том что какие то новые люди оставили свои коментарии тут я не могу понять Реально бесит. Вот примеры:
Здравствуйте, Гость.
Поступил ответ на ваш
комментарий на сайте href="http://ExcelVBA.ru">ExcelVBA.ru
в статье «Парсер сайтов и файлов
(сбор данных с сайта в Excel)»
Вы можете
просмотреть ответ на ваш
комментарий, проследовав по этой
ссылке:
http://ExcelVBA.ru/programmes/Parser#comment-6207
Текст нового комментария (ответа на ваш
комментарий) от EducatedFool:
Символы с тильдой - это разделитель
элементов массива
В настройках поля для вывода включите на
вкладке «Несколько столбцов» опцию
«Выводить массив значений в несколько
столбцов», - тогда в каждый столбец
попадет по одному значению вида
Столбец1|Столбец2|Столбец3
А если надо динамически формировать
названия столбцов, - то включите в
настройках поля на вкладке
«Дополнительно» опцию «Поиск столбца для
вывода»
Тогда будут созданы столбцы (с названием
из первого столбца вашей таблицы), а
значением столбцов будут значения
второго столбца вашей таблицы
Спасибо!
Символы с тильдой - это разделитель элементов массива
В настройках поля для вывода включите на вкладке «Несколько столбцов» опцию «Выводить массив значений в несколько столбцов», - тогда в каждый столбец попадет по одному значению вида Столбец1|Столбец2|Столбец3
А если надо динамически формировать названия столбцов, - то включите в настройках поля на вкладке «Дополнительно» опцию «Поиск столбца для вывода»
Тогда будут созданы столбцы (с названием из первого столбца вашей таблицы), а значением столбцов будут значения второго столбца вашей таблицы
Добрый день.
При использовании команды "Преобразовать таблицу в список с разделителями". Между значениями есть какие-то символы тильда еще что-то тильда. Как убрать эти разделительные символы?Как полученные значения раскидать по отдельным ячейкам?
Не, вы меня не поняли.. Парсер в одну ячейку пихает все данные.
Например:
"Футбол
Хоккей
Теннис
Баскетбол"
А нужно, что бы каждая запись была в отдельной (следующей снизу) ячейки. На одном примере я это как-то поборол, на втором никак не получается =(
Настройки парсера - вкладка ВЫВОД НА ЛИСТ - подвкладка НАСТРОЙКИ ЛИСТА ДЛЯ ВЫВОДА
Там есть опция, по какому столбцу определять последнюю заполненную строку таблицы
Укажите там номер столбца, который заполняется парсером (вместо столбца 1 поставьте столбец номер 2, например, - если во второй столбец парсер выводит данные)
Добрый день! Пытаюсь подружиться с парсером - второй раз натыкаюсь на проблему того, что данные выводятся все в одну ячейку, безе перехода на следующую. Чувствую, что это ерундовый вопрос, но никак не получается найти причину... Помогите плз
Андрей, заказы на парсер принимаются в таком виде
http://excelvba.ru/programmes/Parser/order
Высылайте заказ, - попробуем настроить
С прокруткой обычно проблем нет, - тут есть 2 варианта настройки (использовать браузер IE для прокрутки, или же геренировать запросы, которые скрипты выполняют при прокрутке)
Вопрос только в стоимости настройки, - сделать в любом случае можно.
Страница динамическая и в коде нет самих вопросов, они подгружаются по мере прокрутки, пока никто ни смог забрать вопросы и ответы, может вы сначала попробуете, если получится я оплачу макрос.
Добрый день!
Если нужно получить ссылки на все страницы, то используется действие - "Получить все ссылки пейджера". В большинстве случаев этого достаточно. Иногда нужно определять номер последней страницы и строить массив чисел от 1 до этого числа.
Добрый день.
Изучаю сценарий парсинга http://spravkaru.info. Там идет построение массива из двух страниц. "Добавить новый элемент к массиву Значение %LinkCity%/p/2 Куда поместить в конец."
А если этих страниц много, то прописывать нужно каждую также %LinkCity%/p/3,%LinkCity%/p/4 и т.д. или есть другой автоматизированный способ, независимо от их количества?
Здравствуйте, Андрей.
Да, возможен
Все данные, какие вы можете увидеть на сайте, и вручную скопировать в Excel, - можно и спарсить моей надстройкой.
заказы на парсер принимаются в таком виде
http://excelvba.ru/programmes/Parser/order
Добрый день, возможен ли парсинг вопросов со своего канала на сайте аск фм. мне нужно перенести пjрядка 2500 вопросов на новый сайт, вручную это очень не быстро.
Понял, спасибо
Оптом дешевле ) Стандартный заказ начинается от 1500 рублей. Но у Вас задача, судя по описанию, попроще, поэтому можно сделать скидку. Цена сильно зависит от сложности структуры и "величины" самих сайтов - Вы оформляйте заказ, уже будет понятно, что за сайты и можно будет предметно цену обсуждать.
Олег, в статье (чуть выше) есть ответ на ваш вопрос
может дешевле, может дороже, - если нет задания, точную стоимость назвать не получится