Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Парсер сайта климатического оборудования ballu.ru

Задача: 

Спарсить каталог оборудования с сайта ballu.ru, получив таблицу со столбцами Наименование, Изображение, Инструкция (ПДФ), Анонс, Полное описание.
Кроме того, в отдельные столбцы вывести названия подразделов сайта, а также все характеристики товаров.

ВложениеРазмерЗагрузкиПоследняя загрузка
Файл настроек парсера12.37 КБ2922 недели 4 дня назад
Пример результата в таблице Excel22.39 КБ0Ещё не загружался
Описание: 

Столбцы с характеристиками товара формируются (добавляются) динамически, по мере появления на страницах товаров новых характеристик.

В столбце «Полное описание» выведен HTML-код соответствующего блока страницы товара.
Проблема с наличием картинок в этом блоке (поскольку картинки с вашего сайта не должны ссылаться на сайт, откуда парсилась информация) решена путём скачивания всех картинок из описания товара в папку icons (а в самом столбце описания, HTML-код подредактирован, - чтобы все картинки получили корректную ссылку в атрибуте src)

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
          ____       _               ___     __   
_ _ | __ ) / \ _ __ / _ \ / /_
| | | | | _ \ / _ \ | '_ \ | | | | | '_ \
| |_| | | |_) | / ___ \ | |_) | | |_| | | (_) |
\__, | |____/ /_/ \_\ | .__/ \__\_\ \___/
|___/ |_|
Введите код, изображенный в стиле ASCII-арт.