Парсер сайтов и файлов (парсинг данных с сайта в Excel)

Надстройка Parser для MS Excel: общие сведения

Предназначение программы: быстрый сбор любых данных с различных сайтов или файлов, с выводом результата в Excel.

Основные возможности:

парсинг интернет-магазинов и любых других сайтов (соцсетей, каталогов, объявлений и т.д.)
извлечение данных из файлов формата Word / Excel / txt / PDF
скачивание файлов (изображений, документов, и т.п.)
обновление цен по ссылкам (мониторинг цен конкурентов / РРЦ)

Особенности программы

Простота использования и настройки

Запуск парсера нажатием одной кнопки на ленте Excel
Для настройки парсеров не нужно знание программирования!
Достаточно минимально понимать HTML (что такое теги), и изучить 2 основные команды парсера (загрузка страницы, и поиск тегов). Этого достаточно для 90% задач.
Если сами не разберётесь с настройкой — всегда можно заказать нам настройку парсера под вашу задачу.
Всё что нужно для работы парсера, это Windows 10 (или новее) и Microsoft Excel (версии 2010 или новее)
Иногда ещё нужен браузер Google Chrome (для работы с проблемными сайтами)
Можно настроить программу под несколько разных сайтов (задач), и легко переключаться между настройками через выпадающий список на панели инструментов программы.

Гибкая постобработка данных

Множество текстовых функций для обработки полученной информации
Разнообразные фильтры и функции перекодировки
Работа с переменными и массивами данных
Разбиение значений на отдельные элементы с индивидуальной обработкой
Автоматический вывод характеристик товаров в отдельные столбцы
Интеллектуальный поиск цен на страницах
Поддержка форматов JSON и XML

Продвинутые сетевые возможности

Несколько способов загрузки страниц — WinHTTP / WinAPI / WinINET / IE / Google Chrome
Авторизация — поддержка входа в аккаунты на различных сайтах
Региональные настройки — выбор географического региона для парсинга
HTTP-запросы — поддержка GET и POST методов, конструктор запросов
Cookies и Headers — полная работа с HTTP-заголовками и куки
Многопоточность — до 200 одновременных потоков для ускорения работы
Обход защиты — распознавание капчи через сервис RuCaptcha.com, паузы между запросами
Браузерная интеграция — работа с защищёнными от роботов сайтами через Google Chrome
Кеширование — сохранение данных для повторного использования

Неограниченные возможности поиска и навигации по сайту

Рекурсивный поиск страниц на сайтах
Поиск данных по HTML-тегам и их атрибутам
Автоматическое обнаружение ссылок пагинации (пейджера)
Специализированные функции для работы с HTML-таблицами
Преобразование HTML в текст и пары "название-значение"
Очистка HTML от лишних данных

Интеграция с Excel

Чтение данных из файлов Excel для использования в парсинге
Создание отдельных листов и файлов
Динамическое формирование столбцов для вывода результатов
Использование всех встроенных возможностей Excel (условное форматирование, формат ячеек)
Удобная панель инструментов для запуска парсинга

Работа с файлами

Сбор данных из файлов различных форматов (Word, XML, TXT, Excel, PDF)
Обработка файлов из заданных пользователем папок
Сохранение изображений и документов под заданными именами в настраиваемые папки

С момента выхода программы в 2014 году, её функционал постоянно развивался (вышли сотни обновлений), поэтому сейчас в парсере есть всё, что только может вам понадобиться для сбора данных из интернета.

Более подробно всё это описано в разделе Справка по программе

Дополнительные видео и подробное описание функционала можно найти в разделе Справка по программе

В программе можно настроить несколько парсеров (обработчиков сайтов).
Любой из парсеров настраивается и работает независимо от других.

Примеры настроенных парсеров (можно скачать, запустить, посмотреть настройки)

Видеоинструкция (2 минуты), как запустить готовый (уже настроенный) парсер

Если вам нужен готовый парсер, но вы не хотите разбираться с настройкой,
— закажите настройку парсера разработчику программы. Стоимость настройки под конкретный сайт - от 2500 рублей.
Настройка под заказ выполняется только при условии приобретения лицензии на надстройку «Парсер» (4000 руб)

Инструкция (с видео) по заказу настройки парсера
По всем вопросам, связанным с заказом, готов проконсультировать вас в Телеграм.

Как скачать и протестировать программу

Для загрузки надстройки Parser воспользуйтесь кнопкой Скачать программу

Если не удаётся скачать надстройку, читайте инструкцию про антивирус

Если скачали файл, но он не запускается, читайте почему не появляется панель инструментов

Это полнофункциональная пробная (TRIAL) версия, у вас есть 10 дней,
в течение которых вы можете протестировать работу программы.

Этого вполне достаточно, чтобы всё настроить и проверить, используя раздел Справка по программе

Если вам понравится, как работает программа, вы можете Купить лицензию

Лицензия (для постоянного использования) стоит 4000 рублей.

В эту стоимость входит активация на 2 компьютера (вы сможете пользоваться программой и на работе, и дома).
Если нужны будут дополнительные активации, их можно будет в любой момент приобрести по 1000 рублей за каждый дополнительный компьютер.

Добавить комментарий
926863 просмотра

Здравствуйте!
Подскажите, пожалуйста, а с такого сайта будет работать ваш парсер:https://holstshop.ru/catalog/painters/klod-zhozef-verne/?
Это не совсем интернет-магазин, нужна большая фотография, название, описание внизу с артикулом. Парсить хотел по художникам.

Юрий, 26 Июн 2019 - 01:03.#2

Друзья, просмотрев видео все получилось с помощью пост-запросов, спасибо.

Юрий, 25 Июн 2019 - 23:51.#3

Ребята здравствуйте, скажите пожалуйста, есть ли пример настроенных парсеров, как получить данные с выполнения скрипта, а то без примера ну ни как.

Игорь (администратор сайта), 21 Июн 2019 - 16:01.#4

Либо пост-запросом, либо открывая страницу в браузере IE
Подробнее - в видеоинструкции: https://excelvba.ru/programmes/Parser/manuals/Loading_Pages_and_Logon

Гость, 21 Июн 2019 - 15:55.#5

А как можно получить ссылки на товары например с сайтов, где они формируются с помощью скрипта? и в коде страницы этих ссылок просто нет?

Игорь (администратор сайта), 10 Июн 2019 - 11:43.#6

Михаил, да, сможем.
заказы на парсер принимаются в таком виде
http://excelvba.ru/programmes/Parser/order

Михаил, 10 Июн 2019 - 11:17.#7

Добрый день.
На сайте официального портала судов общей юрисдикции города Москвы
в разделе поиск, хочу выбрать всю информацию по категориям дел
сможете помочь
https://www.mos-gorsud.ru/search
→ "производство" → "категория дел"

Игорь (администратор сайта), 8 Июн 2019 - 01:17.#8

Юрий, да, можно
Часто настраиваем под такие сайты:
https://excelvba.ru/programmes/Parser/samples/category/Sport

Юрий, 7 Июн 2019 - 22:26.#9

Ребята здравствуйте, спасибо за Ваши труды и умения, парсер очень мощный, скажите пожалуйста спарсерить такие данные сием чудом можно?
https://ibb.co/HtMDqr8

Игорь (администратор сайта), 29 Май 2019 - 20:45.#10

Да, возможно.

Гость, 29 Май 2019 - 19:31.#11

Здравствуйте!
Есть список товаров, есть сайт на котором все товары есть, нужно обойти этот сайт по готовым ссылкам товаров и взять только цены, это возможно?

Игорь (администратор сайта), 29 Май 2019 - 00:39.#12

Иван, по пункту 1, это основной функционал яндекса и гугла, - ИСКАТЬ что-либо по заданному тексту
Просто берем первый результат поиска по запросу «название организации» официальный сайт

По пункту 2, так не получится. Все сайты разные. Настолько разные, что таким способом и с 10% сайтов не собрать описание организации.

По пункту 3, - можно, только при наличии четкого задания, где что как искать.
Посидев над составлением этого задания месяц-другой (пытаясь написать подробный алгоритм, подходящий для произвольной организации), вы поймёте, о чём я говорю.
На ближайшие лет 10 об этом пункте 3 можете забыть, - потом, глядишь, и искусственный интеллект изобретут, тогда можно будет подумать о воплощении ваших задумок.

Иван, 29 Май 2019 - 00:06.#13

Игорь, спасибо за ответ.

"пункт 1 - тут поможет поиск в яндексе или гугле, качество результата будет около 90%" — Вы имеете в виду, что есть функционал яндекса или гугла, который может автоматически найти сайты для массива наименований компаний? Или каким-то образом использовать яндекс или гугл в рамках вашей программы Parser?

"пункт 2 - если только придумаете, с какого ОДНОГО сайта эти данные брать" — допустим, если пункт 1 выполнился и программа нашла сайт и вбила его в ячейку excel, то взять описание компании с него получится (прехедер в поисковике, например), я правильно понимаю?

"пункт 3 - не реализуем (ни моей программой, ни любой другой). Эти данные нигде не хранятся в упорядоченном виде." — по ключевым словам "форум, выставка и т.д." хотя бы выдать массив информации, так нельзя?

Игорь (администратор сайта), 28 Май 2019 - 23:27.#14

Здравствуйте, Иван
пункт 1 - тут поможет поиск в яндексе или гугле, качество результата будет около 90%
пункт 2 - если только придумаете, с какого ОДНОГО сайта эти данные брать
пункт 3 - не реализуем (ни моей программой, ни любой другой). Эти данные нигде не хранятся в упорядоченном виде.

Иван, 28 Май 2019 - 20:52.#15

Здравствуйте.
В файле excel столбец с 3000+ наименований компаний.
Задача:
1. Найти для каждой компании официальный сайт,
2. Найти краткое описание деятельности компании,
3. Найти названия выставок, в которых эти компании когда-либо участвовали или будут участвовать.
Поместить эти данные в три столбца напротив каждой компании, соответственно.
Можно ли сделать это с помощью вашей программы? Спасибо.

Сергей, 22 Май 2019 - 15:43.#16

Программа куплена, мысль понятно, спасибо по Вашей рекомендации разобрался.

Игорь (администратор сайта), 22 Май 2019 - 00:31.#17

Михаил, это прямые ссылки на скачивание файлов
Всё должно работать

Сергей, не понял, какое отношение эта задача имеет к парсеру
Парсер умеет такое, - разбиваем исходную строку (из столбца А) на массив, почти аналогично делаем со строкой из столбца В, потом применяем действие Проверка на выполнение условия (условие - не содержится в массиве)
Напишите мне в скайп, попробую помочь (если уже покупали программу-парсер)

Сергей, 21 Май 2019 - 19:46.#18

Поправлю: Как в ячейке C2 получить числа 2 3 5 6 (удалить вхождение одного массива в другой)

Сергей, 21 Май 2019 - 19:42.#19

Как решить следующую задачу:
ячейка A2 содержит числа: 1 2 3 4 5 6
ячейка B2 содержит числа: 1 4
Как в ячейке C2 получить числа 2 5 6 (удалить вхождение одного массива в другой)
Строк несколько тысяч, значения разнообразные, но всегда уникальны. Пока на ум приходить удалить через таблицу замен, но это будет долго.

Михаил, 21 Май 2019 - 17:54.#20

https://excelvba.ru/programmes/Parser#comment-10142
А то что это не прямая ссылка на файл картинки, а что-то другое. По данным ссылкам парсер скачать файлы не может.

Игорь (администратор сайта), 21 Май 2019 - 16:57.#21

Ярослав, список запланированных парсеров пока нет возможности посмотреть.
Я с такой необходимостью ни разу не сталкивался, потому и не стал делать.

Михаил, ваш вопрос не понятен.
Указанные вами ссылки ведут напрямую на картинки
В чем сложность, и что конкретно у вас не получается, мне не ясно.

Михаил, 21 Май 2019 - 14:59.#22

Добрый день. Подскажите пожалуйста как парсеру скачать ссылку на картинку, если в теле вот такие ссылки

http://www.ru.roca.com/RocaResourceServlet/resources/getTransformation?i...

http://www.ru.roca.com/servlet/getTechnicalDrawingTransformation?product...

есть ли примеру решения подобных задач

Ярослав, 18 Май 2019 - 12:54.#23

Есть ли возможность посмотреть список всех запланированных парсеров ?
Было бы очень удобно.

Дмитрий, 11 Май 2019 - 18:57.#24

Возможно офтоп. Есть ли возможность из файла xls по шаблону перегнать данные в xml ? спасибо

Эдуард, 5 Май 2019 - 20:05.#25

Благодарю!

Игорь (администратор сайта), 5 Май 2019 - 19:48.#26

Эдуард, это возможно.
Читайте справку по действию "Случайное число"

Эдуард, 5 Май 2019 - 17:58.#27

Здравствуйте, Игорь!
Хочу спросить, нельзя ли в парсере реализовать возможность установки задержки между очередным запросом по генератору случайных чисел. В Экселе есть подобные встроенные функции. Генерация значения в диапазоне от и до. Столкнулся с тем, что на буржуйских ресурсах ПО определяет , что запросы посылает не человек, что сделать не сложно, учитывая, что период постоянен. А так можно будет прикинуться юзером.

Гость, 22 Апр 2019 - 18:43.#28

Игорь, вы уже отвечали Олегу на этот вопрос, но я не смог разобраться, как вывести каждый элемент массива в отдельную строку в один столбец, не могли бы объяснить более подробно. Спасибо.

Гость, 20 Апр 2019 - 19:04.#29

Спасибо разобрался.

Гость, 20 Апр 2019 - 18:52.#30

Добрый день. Парсер вводит все найдены товары в одну строку.
Как быть?

Скачать надстройку

Parser.xla

версия 4.8.2 от 08.04.2026

история версий программы

Купить лицензию

Посмотреть стоимость

Количество компьютеров	Стоимость лицензии
1 компьютер	4000 руб.
2 компьютера	4000 руб.
3 компьютера	5000 руб.
4 компьютера	6000 руб.
5 компьютеров	7000 руб.
6 компьютеров	8000 руб.
7 компьютеров	9000 руб.
8 компьютеров	10000 руб.
9 компьютеров	11000 руб.
10 компьютеров	12000 руб.
12 компьютеров	14000 руб.
14 компьютеров	16000 руб.
16 компьютеров	18000 руб.
18 компьютеров	20000 руб.
20 компьютеров	22000 руб.

При покупке от юр.лица (по договору, оплата по безналу) — другие цены

Справка по программе