Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Парсер сайта климатического оборудования ballu.ru

Задача: 

Спарсить каталог оборудования с сайта ballu.ru, получив таблицу со столбцами Наименование, Изображение, Инструкция (ПДФ), Анонс, Полное описание.
Кроме того, в отдельные столбцы вывести названия подразделов сайта, а также все характеристики товаров.

ВложениеРазмерЗагрузкиПоследняя загрузка
Файл настроек парсера12.37 КБ2847 недель 5 дней назад
Пример результата в таблице Excel22.39 КБ0Ещё не загружался
Описание: 

Столбцы с характеристиками товара формируются (добавляются) динамически, по мере появления на страницах товаров новых характеристик.

В столбце «Полное описание» выведен HTML-код соответствующего блока страницы товара.
Проблема с наличием картинок в этом блоке (поскольку картинки с вашего сайта не должны ссылаться на сайт, откуда парсилась информация) решена путём скачивания всех картинок из описания товара в папку icons (а в самом столбце описания, HTML-код подредактирован, - чтобы все картинки получили корректную ссылку в атрибуте src)

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
  _____ __     __          _   ____        
|__ / \ \ / / _ _ (_) | __ ) ___
/ / \ \ / / | | | | | | | _ \ / __|
/ /_ \ V / | |_| | | | | |_) | \__ \
/____| \_/ \__, | |_| |____/ |___/
|___/
Введите код, изображенный в стиле ASCII-арт.