Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Парсер сайта климатического оборудования ballu.ru

Задача: 

Спарсить каталог оборудования с сайта ballu.ru, получив таблицу со столбцами Наименование, Изображение, Инструкция (ПДФ), Анонс, Полное описание.
Кроме того, в отдельные столбцы вывести названия подразделов сайта, а также все характеристики товаров.

ВложениеРазмерЗагрузкиПоследняя загрузка
Файл настроек парсера12.37 КБ27710 недель 2 дня назад
Пример результата в таблице Excel22.39 КБ0Ещё не загружался
Описание: 

Столбцы с характеристиками товара формируются (добавляются) динамически, по мере появления на страницах товаров новых характеристик.

В столбце «Полное описание» выведен HTML-код соответствующего блока страницы товара.
Проблема с наличием картинок в этом блоке (поскольку картинки с вашего сайта не должны ссылаться на сайт, откуда парсилась информация) решена путём скачивания всех картинок из описания товара в папку icons (а в самом столбце описания, HTML-код подредактирован, - чтобы все картинки получили корректную ссылку в атрибуте src)

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
             _       ___    _   ____          
_ __ / \ / _ \ (_) |___ \ _ _
| '_ \ / _ \ | (_) | | | __) | | | | |
| |_) | / ___ \ \__, | | | / __/ | |_| |
| .__/ /_/ \_\ /_/ |_| |_____| \__,_|
|_|
Введите код, изображенный в стиле ASCII-арт.