Пройти парсером по списку сайтов, и попытаться найти адрес электронной почты (email) на каждом сайте.
Настройка является демонстрацией возможностей парсера по анализу информации.
Тестовая настройка, выложенная в статье, проходит по списку предварительно отобранных сайтов и пытается найти на основной странице сайта е-мейл. Обратите внимание, сайты специально подобраны для примера. При реальной работе настройки процент найденных е-мейлов будет ниже.
На лист для вывода попадает в 1 столбец название сайта, на который заходит граббер. Во 2-ой столбец выводятся через точку с запятой все найденные е-мейлы.
На многих сайтах первая страница не содержит е-мейлов, но они содержатся на странице "Контакты". Полный вариант настройки парсера способен осуществлять поиск страницы Контакты (в разных вариантах написания) на сайте и дополнительно искать е-мейлы там. При желании можно указывать сайту команду искать е-мейлы на первых 10 страницах сайтах.
Дополнительные возможности настройки:
1. Парсить список сайтов с заданного столбца файла Эксель.
2. Дописывать при необходимости к ссылке http://
3. Не учитывать исключения. Например, адрес счетчика Rating @ mail.ru, который встречается на многих сайтах.
4. Выводить каждый найденный е-мейл в отдельную ячейку
5. Выводить е-мейлы в виде гиперссылки mailto: При нажатии на такую ссылку сразу откроется редактор писем с новым сообщением адресату.
Настройка может использоваться как самостоятельно, так и быть встроена в другие настройки парсера (например, на каком-то сайте есть интернет-сайты компаний, но нет их е-мейлов).
ВНИМАНИЕ! Работоспособность настройки сильно зависит от анализируемых сайтов! Процент найденных е-мейлов предугадать сложно. Настройка предоставляется на условиях "как есть".
Для приобретения полной версии настройки этого парсера, обращайтесь на почту, с указанием ссылки на эту статью.
Комментарии
Евгений, этих данных нет в открытом доступе, - потому, никак их не спарсить.
Это конфиденциальные данные, доступные только владельцу сайта.
Здравствуйте. У меня вопрос. Возможно ли спарсить mail, на который отправляются письма из формы обратной связи?
Отправить комментарий