Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Парсер сайта rusprofile.ru - Информация о юридических лицах и индивидуальных предпринимателях

Задача: 

Найти организации с заданным словом в названии, вывести информацию о них: полное наименование, ИНН, статус (действующая/недействующая), ФИО руководителя, адрес.

ВложениеРазмерЗагрузкиПоследняя загрузка
Образец выгрузки парсером данных с сайта rusprofile.ru в формате Эксель52.37 КБ0Ещё не загружался
Настройки парсера для сбора информации с сайта rusprofile.ru6.01 КБ4401 час 40 минут назад
Описание: 

Тестовая настройка парсера собирает данные об организациях с сайта rusprofile.ru с заданным словом в названии, выводит следующую информацию о первых 100 найденных организациях для каждого запроса:

№ п/п
Название с rusprofile
ИНН
Недействующая
ссылка
Руководитель
Адрес

Полная настройка парсера может перебирать все страницы поиска (а не только первую), также можно настроить поиск организации по ОГРН, ИНН, ФИО директора и адресу. Настройка может осуществлять сверку названия и выводить только полностью совпадающие с запросом компании. Может исключать из вывода недействующие организации и многое другое.

При необходимости можно настроить сбор информации из карточки компаний, туда входят:
Выписка из ЕГРЮЛ
Виды деятельности ОКВЭД
Учредители
Реквизиты
Сведения Росстата
Сведения о регистрации в ФНС
Сведения о регистрации в ПФР
Сведения о регистрации в ФСС
Сведения МСП
и другая информация.

Для приобретения полной версии настройки этого парсера, обращайтесь на почту, с указанием ссылки на эту статью.

Комментарии

Как скачать парсер?

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
   ____  __   __  ____        _       _   _____ 
/ ___| \ \ / / / ___| __| | | | |___ |
| | _ \ V / \___ \ / _` | _ | | / /
| |_| | | | ___) | | (_| | | |_| | / /
\____| |_| |____/ \__,_| \___/ /_/
Введите код, изображенный в стиле ASCII-арт.