Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Поиск цен на книги по ISBN на сайтах ozon.ru, labirint.ru, kniga.ru

Задача: 

По списку номеров ISBN из второго столбца, найти книги в интернет-магазинах ozon.ru, labirint.ru, kniga.ru,
и вывести текущие цены (с гиперссылками на страницы книг на указанных сайтах).
В дополнительных столбцах вывести аннотацию с сайта Labirint.ru, и тег («Бестселлер», «Новинка» и т.п.) с сайта ozon.ru

ВложениеРазмерЗагрузкиПоследняя загрузка
Пример исходных данных и результата: ISBN Search Prices Result.xlsx12.81 КБ0Ещё не загружался
Старые настройки парсера сайтов ozon.ru, labirint.ru, kniga.ru (не работают из-за смены сайта)12.89 КБ134810 недель 2 дня назад
Алгоритм работы парсера72.61 КБ0Ещё не загружался
Новый файл настроек парсера, для первых 2 сайтов (ozon.ru, labirint.ru)21.95 КБ16510 недель 2 дня назад
Описание: 

Особенностью данного парсера является механизм работы с сайтом OZON.ru
(на сайте есть "защита" от парсеров, — при отсутствии в запросе заголовков, свойственных браузеру, OZON.ru выдаёт страницу с текстом «Извините. Вам запрещен доступ на сайт.»)
Для обхода этой проблемы, парсер представляется браузером Chrome (передавая соответствующие заголовки запроса)
Для некоторых заголовков запроса, включена опция «Использовать во всех запросах» — чтобы при редиректе эти заголовки продолжали передаваться.

Комментарии

Для Ozon никакой парсер не нужен, так как есть полный список товаров в удобных XML http://www.ozon.ru/context/partner_xml/
На данный момент в каталоге содержится более 500 тысяч книг.

Сайты меняются, - я давно очень настраивал эти парсеры, потому не работает.
На скорую руку переделал 2 из 3 парсеров (ozon.ru и labirint.ru), прикрепил к статье новый файл настроек
Можете убедиться, что всё работает

Не работает. Не загружает ничего. Даже в файл ISBN Search Prices Result.xlsx. Нет уверенности что приобретенная программа будет работать с этими сайтами.

В данным случае, настройки (как и пример исходного файла Excel) выложены на сайте (т.е. вы можете этим пользоваться бесплатно)
Останется только приобрести программу (2500 руб стоит)
Настройки парсера делал давно, - не уверен, что до сих пор все работает (сайты могли поменяться), так что скачайте и проверьте (если не работает, то настройка будет за доп плату)

Здравствуйте! Сколько стоит парсер "поиск цен на книги по ISBN на сайтах ozon.ru, labirint.ru, kniga.ru" и как его приобрести?

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
       __     __                       __        __
____ \ \ / / _ __ __ __ ____ \ \ / /
|_ / \ \ / / | '_ \ \ \ / / |_ / \ \ /\ / /
/ / \ V / | | | | \ V / / / \ V V /
/___| \_/ |_| |_| \_/ /___| \_/\_/
Введите код, изображенный в стиле ASCII-арт.