Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Сбор данных об организации по ОКПО с сайта focus.kontur.ru

Задача: 

По исходной таблице, содержащей список названий и кодов ОКПО организаций, сформировать таблицу по данным сайта Контур.Фокус со следующими столбцами:
ИНН, КПП, ОГРН, ОКПО, Адрес организации, Руководитель, Должность руководителя, Уставный капитал, Баланс, Выручка, Чистая прибыль, Телефоны (до 3 шт), Виды деятельности.

ВложениеРазмерЗагрузкиПоследняя загрузка
Список организаций - данные с focus.kontur.ru34.04 КБ0Ещё не загружался
Описание: 

Для работы парсера необходимо иметь платную подписку на доступ к поиску по сайту focus.kontur.ru
Перед запуском парсера, необходимо авторизоваться в браузере Internet Explorer (программа использует его для запроса сведений)

Парсер берет код ОКПО организации из первого столбца таблицы, при необходимости добавляет нули в начале кода (чтобы получился 8-значный код),
и формирует ссылку вида https://focus.kontur.ru/search?query=XXX
где вместо XXX подставляется код ОКПО (можно также использовать для поиска ИНН, ОГРН или название организации)
Страница по указанной ссылке загружается, и берется первый результат поиска, соответствующий искомому коду ОКПО.

Найденная в результатах поиска ссылка загружается средствами браузера Internet Explorer, — т.к. иначе часть данных будет скрыта.
Открывшаяся страница организации обрабатывается парсером, - и данные выводятся в дополнительно созданные столбцы

Телефоны преобразуются к формату 8##########, в список кодов деятельности попадают все номера с отдельно загруженной страницы
В столбец 3 «С» выводится ссылка на страницу организации, - для возможности проверки результата на сайте

Смотрите также другой парсер организаций для сайта Контур.Фокус,
помогающий найти по ИНН и выявить недобросовестных котрагентов

По вопросам приобретения настроек парсера, обращайтесь в скайп или на почту

Комментарии

Здравствуйте, Сергей.
Поиск ведется по конкретному сайту, который принимает в качестве искомого значения ИНН, ОГРН, название, адрес или ФИО
Будет ли поиск работать по другим параметрам, - не знаю, не пробовал (откройте сайт Контур Фокус, и попробуйте поискать. если ищется - то и парсер можно настроить. если не ищет по сайту как вам надо - то и парсер не поможет)

Добрый день, есть ли возможность задать вид деятельности и регион для поиска?

У меня есть (логин-пароль) и парсер Ваш куплен, можно увидеть образец настройки.

для работы парсера нужна авторизация на контур.фокусе, - я не могу выложить настройки с конфиденциальной информацией (логин-пароль)

а файл настроек для данного примера будет?

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
  ____    _____  ____   __     __   __         _ 
| _ \ |__ / | _ \ \ \ / / / /_ __| |
| |_) | / / | |_) | \ \ / / | '_ \ / _` |
| _ < / /_ | _ < \ V / | (_) | | (_| |
|_| \_\ /____| |_| \_\ \_/ \___/ \__,_|
Введите код, изображенный в стиле ASCII-арт.