По списку номеров ISBN из второго столбца, найти книги в интернет-магазинах ozon.ru, labirint.ru, kniga.ru,
и вывести текущие цены (с гиперссылками на страницы книг на указанных сайтах).
В дополнительных столбцах вывести аннотацию с сайта Labirint.ru, и тег («Бестселлер», «Новинка» и т.п.) с сайта ozon.ru
Особенностью данного парсера является механизм работы с сайтом OZON.ru
(на сайте есть "защита" от парсеров, — при отсутствии в запросе заголовков, свойственных браузеру, OZON.ru выдаёт страницу с текстом «Извините. Вам запрещен доступ на сайт.»)
Для обхода этой проблемы, парсер представляется браузером Chrome (передавая соответствующие заголовки запроса)
Для некоторых заголовков запроса, включена опция «Использовать во всех запросах» — чтобы при редиректе эти заголовки продолжали передаваться.
Комментарии
Для Ozon никакой парсер не нужен, так как есть полный список товаров в удобных XML http://www.ozon.ru/context/partner_xml/
На данный момент в каталоге содержится более 500 тысяч книг.
Сайты меняются, - я давно очень настраивал эти парсеры, потому не работает.
На скорую руку переделал 2 из 3 парсеров (ozon.ru и labirint.ru), прикрепил к статье новый файл настроек
Можете убедиться, что всё работает
Не работает. Не загружает ничего. Даже в файл ISBN Search Prices Result.xlsx. Нет уверенности что приобретенная программа будет работать с этими сайтами.
В данным случае, настройки (как и пример исходного файла Excel) выложены на сайте (т.е. вы можете этим пользоваться бесплатно)
Останется только приобрести программу (2500 руб стоит)
Настройки парсера делал давно, - не уверен, что до сих пор все работает (сайты могли поменяться), так что скачайте и проверьте (если не работает, то настройка будет за доп плату)
Здравствуйте! Сколько стоит парсер "поиск цен на книги по ISBN на сайтах ozon.ru, labirint.ru, kniga.ru" и как его приобрести?
Отправить комментарий