mail mail
Нужен макрос для Excel?
Сделайте заказ прямо сейчас!
Ищете готовое решение?
Выбирайте и покупайте!
У вас есть интернет-магазин?
Настроим парсер под любой сайт!

Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Скачивание базы организаций с контактными данными с сайта bus.gov.ru

Задача: 

Сформировать таблицу со списком организаций с сайта bus.gov.ru по выбранному региону и сферам деятельности.
Необходимые данные: Категория, Регион, Название учреждения, Адрес, Телефон, Должность руководителя, ФИО руководителя, Email (адрес электронной почты), ИНН, КПП, Коды ОКВЭД, Виды деятельности по ОКВЭД, Вид учреждения, Тип учреждения.

ВложениеРазмерЗагрузкиПоследняя загрузка
Пример результата работы парсера для сайта bus.gov.ru18.45 КБ0Ещё не загружался
Настройки парсера bus.gov.ru43.29 КБ1735 часов 30 минут назад
Пример результата парсера bus.gov.ru с загрузкой в 2 этапа (больше столбцов в результате)25.65 КБ0Ещё не загружался
Описание: 

bus.gov.ru — это официальный сайт для размещения информации о государственных (муниципальных) учреждениях
Потому, парсинг сайта bus.gov.ru пользуется популярностью у желающих выполнить рассылку писем по этим организациям.

При запуске парсера, выводится диалоговое окно, где можно выбрать регион (или указать опцию «все регионы»), а также задать необходимые сферы деятельности (можно выбрать один или несколько пунктов)
Для получения контактных данных (email) парсер выполняет дополнительные запросы к серверу bus.gov.ru (по каждой строке данных), что увеличивает время работы парсера.
(если вам нужен только список организаций, - то парсер будет работать в разы быстрее)

В тестовой версии парсера, вывод данных ограничен 50 строками по любому запросу.
Для приобретения полной версии, пишите на почту order@excelvba.ru или в скайп ExcelVBA.ru
Стоимость полной версии составляет 1500 рублей (+ стоимость программы-парсера 2500 руб)
Итого, готовое решение вам обойдется в 4000 рублей

UPD: в новой версии этого парсера, загрузка данных производится в 2 этапа:
сначала запускается парсер «1 - ссылки», который заполняет только первые 6 столбцов
после этого запускается парсер «2 - данные», который уже прогружает карточки организаций, и выводит основную информацию

Это связано с ограничениями сайта (после 700 запросов сайт запрещает доступ к данным на некоторое время)
Второй парсер в этом варианте настройки можно останавливать, - он продолжит работу с места остановки (вы его запустите снова через 1-2 часа, когда сайт снимет ограничение на доступ с вашего IP адреса)

Пример результата по этому варианту содержит больше выводимых столбцов (см. второй прикреплённый файл Excel)

Комментарии

Виктор, так вот в этой статье как раз и прикреплён пример настроек с таким далоговым окном выбора
Т.е. ответ - да, можно.

Сообщите мене пожалуйста существует ли возможность создания настройки парсера сайтов, при запуске которого выводится диалоговое окно, где можно выбрать регион,а также выбрать один или несколько населённых пунктов региона?

Ответил в скайпе

1. Сколько стоит полная версия парсера ?
2. Можно ли увеличить количество скачиваемой информации в настройках ? (интересует дополнительно: веб-сайт, ИНН, краткое название, тип учреждения,вид деятельности по оквэд)
А может у вас уже есть готовый парсер, который скачивает полную контактно-реквизитную информацию ?

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
                          _             __   __    _ 
_ _ _ __ ___ __| | __ __ \ \ / / (_)
| | | | | '_ ` _ \ / _` | \ \ /\ / / \ V / | |
| |_| | | | | | | | | (_| | \ V V / | | | |
\__,_| |_| |_| |_| \__,_| \_/\_/ |_| _/ |
|__/
Введите код, изображенный в стиле ASCII-арт.