Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Сбор email на интернет-сайтах

Задача: 

Пройти парсером по списку сайтов, и попытаться найти адрес электронной почты (email) на каждом сайте.

ВложениеРазмерЗагрузкиПоследняя загрузка
Образец парсинга email с сайтов в формате Эксель8.77 КБ0Ещё не загружался
Настройки парсера (граббера) для поиска email на сайте6.42 КБ8931 день 25 минут назад
Описание: 

Настройка является демонстрацией возможностей парсера по анализу информации.

Тестовая настройка, выложенная в статье, проходит по списку предварительно отобранных сайтов и пытается найти на основной странице сайта е-мейл. Обратите внимание, сайты специально подобраны для примера. При реальной работе настройки процент найденных е-мейлов будет ниже.

На лист для вывода попадает в 1 столбец название сайта, на который заходит граббер. Во 2-ой столбец выводятся через точку с запятой все найденные е-мейлы.

На многих сайтах первая страница не содержит е-мейлов, но они содержатся на странице "Контакты". Полный вариант настройки парсера способен осуществлять поиск страницы Контакты (в разных вариантах написания) на сайте и дополнительно искать е-мейлы там. При желании можно указывать сайту команду искать е-мейлы на первых 10 страницах сайтах.

Дополнительные возможности настройки:
1. Парсить список сайтов с заданного столбца файла Эксель.
2. Дописывать при необходимости к ссылке http://
3. Не учитывать исключения. Например, адрес счетчика Rating @ mail.ru, который встречается на многих сайтах.
4. Выводить каждый найденный е-мейл в отдельную ячейку
5. Выводить е-мейлы в виде гиперссылки mailto: При нажатии на такую ссылку сразу откроется редактор писем с новым сообщением адресату.

Настройка может использоваться как самостоятельно, так и быть встроена в другие настройки парсера (например, на каком-то сайте есть интернет-сайты компаний, но нет их е-мейлов).

ВНИМАНИЕ! Работоспособность настройки сильно зависит от анализируемых сайтов! Процент найденных е-мейлов предугадать сложно. Настройка предоставляется на условиях "как есть".

Для приобретения полной версии настройки этого парсера, обращайтесь на почту, с указанием ссылки на эту статью.

Комментарии

Евгений, этих данных нет в открытом доступе, - потому, никак их не спарсить.
Это конфиденциальные данные, доступные только владельцу сайта.

Здравствуйте. У меня вопрос. Возможно ли спарсить mail, на который отправляются письма из формы обратной связи?

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
          ____    _  __           ____    __   
__ _ / ___| | |/ / _ __ / ___| / /_
/ _` | \___ \ | ' / | '_ \ | | _ | '_ \
| (_| | ___) | | . \ | |_) | | |_| | | (_) |
\__, | |____/ |_|\_\ | .__/ \____| \___/
|___/ |_|
Введите код, изображенный в стиле ASCII-арт.