Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Парсер сайта климатического оборудования ballu.ru

Задача: 

Спарсить каталог оборудования с сайта ballu.ru, получив таблицу со столбцами Наименование, Изображение, Инструкция (ПДФ), Анонс, Полное описание.
Кроме того, в отдельные столбцы вывести названия подразделов сайта, а также все характеристики товаров.

ВложениеРазмерЗагрузкиПоследняя загрузка
Файл настроек парсера12.37 КБ27910 недель 3 дня назад
Пример результата в таблице Excel22.39 КБ0Ещё не загружался
Описание: 

Столбцы с характеристиками товара формируются (добавляются) динамически, по мере появления на страницах товаров новых характеристик.

В столбце «Полное описание» выведен HTML-код соответствующего блока страницы товара.
Проблема с наличием картинок в этом блоке (поскольку картинки с вашего сайта не должны ссылаться на сайт, откуда парсилась информация) решена путём скачивания всех картинок из описания товара в папку icons (а в самом столбце описания, HTML-код подредактирован, - чтобы все картинки получили корректную ссылку в атрибуте src)

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
  ____    _     _____    ___    ____          
| _ \ | |_ |___ | / _ \ | _ \ _ _
| |_) | | __| / / | | | | | | | | | | | |
| __/ | |_ / / | |_| | | |_| | | |_| |
|_| \__| /_/ \__\_\ |____/ \__,_|
Введите код, изображенный в стиле ASCII-арт.