Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Парсер ecstuning.com - парсер запчастей и аксессуаров для тюнинга

Задача: 

Скачать изображения с сайта ecstuning.com на жесткий диск, назвать файл номером производителя.

ВложениеРазмерЗагрузкиПоследняя загрузка
Настройки парсера для сбора информации с сайта ecstuning.com6.53 КБ2852 недели 4 дня назад
Образец выгрузки данных с сайта ecstuning.com в формате Эксель8.41 КБ0Ещё не загружался
Описание: 

Тестовая настройка скачивает 10 изображений из раздела оригинальных запчастей VW/Audi. После окончания парсинга открывается папка со скачанными изображениями.

Изображение нужно было получить в максимальном качестве, но без "водяного знака" сайта. Все изображения непосредственно на странице товара содержат водяной знак, "превью" в общем списке слишком маленькое. В процессе настройки было замечено, что фотографии разных размеров называются одинаковым именем, отличается только окончание. Методом подбора было установлено, что максимальный размер без "водяного знака" - это 300 пикселей. Поэтому ссылка на фото формируется искусственным способом.

В надстройке предусмотрено, что фото товара на сайте может отсутствовать, в этом случае имя файла не выводится, только название (столбец А).

Полная настройка скачивает все фотографии с заданного раздела, возможен вывод другой информации - цены, наличия, описания товара.

PS Сайт ecstuning.com при большом количестве запросов с одного IP блокирует доступ, поэтому для больших выгрузок надо либо ставить большую паузу между запросами (опция настроек), либо парсить данные через прокси-серверы.

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
          _   _                       _  __  _ 
_ __ | \ | | _ _ _ __ ___ | |/ / / |
| '_ \ | \| | | | | | | '_ ` _ \ | ' / | |
| |_) | | |\ | | |_| | | | | | | | | . \ | |
| .__/ |_| \_| \__, | |_| |_| |_| |_|\_\ |_|
|_| |___/
Введите код, изображенный в стиле ASCII-арт.