Парсинг контента на сайте мировых судов Тульской области

Задача: 

Собрать данные о работе мировых судей из открытого источника - сайт Мировых судей Тульской области - название участка, адрес и телефон, ФИО основных сотрудников, реквизиты государственной пошлины, ссылки на сайт и госпошлину.

Описание: 

Тестовая настройка парсера скачивает информацию о первых 20 судах Тульской области и выводит в файл Эксель следующие столбцы:

Код
Название
Адрес
Телефон
Часы работы
Судья
Секретарь судебного заседания
Помощник судьи
Ссылка на карту
Территориальная подсудность
Наименование получателя платежа
ИНН
Расчетный счет
Банк
БИК
КПП
КБК
OKTMO
URL
Ссылка на реквизиты

Особенностью данного парсера является то, что настройка перебирает множество страниц, содержание которых может отличаться, в связи с этим настройка осуществляет поиск данных по маске.

Например, где-то написано так:

В УФК по Тульской области (Межрайонная ИФНС России № 8 по Тульской области)
ИНН – 7130015434
КПП – 713001001

А где-то так:

Получатель платежа Управление Федерального казначейства по Тульской области (Межрайонная ИФНС России № 8 по Тульской области)
ИНН получателя 7130015434
КПП получателя 713001001

Полная настройка парсера скачивает данные со всех участков и способна выводить дополнительную информацию об участках.

Также возможна настройка аналогичного парсера для других регионов.

Для приобретения полной версии настройки этого парсера, обращайтесь на почту, с указанием ссылки на эту статью.

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
 __     __   __   _               __     _    
\ \ / / / _| | | __ __ / /_ | | __
\ \ / / | |_ | | \ \/ / | '_ \ | |/ /
\ V / | _| | |___ > < | (_) | | <
\_/ |_| |_____| /_/\_\ \___/ |_|\_\
Введите код, изображенный в стиле ASCII-арт.