Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Парсинг сайта opt.citystarwear.com - оптовый сайт одежды (обработка различных пейджеров)

Задача: 

Собрать ассортимент товаров с интернет-магазина одежды. Каждый крупный раздел вывести на свой лист, указать подраздел, название товара, цену и ссылку на картинку.

ВложениеРазмерЗагрузкиПоследняя загрузка
Настройки парсера для сбора информации с сайта opt.citystarwear.com7.13 КБ2145 дней 15 часов назад
Образец выгрузки парсером данных с сайта opt.citystarwear.com в формате Эксель25.07 КБ0Ещё не загружался
Описание: 

Данная настройка интересна способом обработки различных пейджеров PAGEN_1, PAGEN_2, PAGEN_3, которые встречаются на страницах этого сайта. Текущая версия парсера 2.9.2 не распознает все эти типы префиксов автоматически (в ближайшей версии планируется расширить стандартный список префиксов), поэтому в настройке сначала ищется префикс, а потом используется поиск пейджера с этим конкретным префиксом.

Такой способ настройки может быть применен для сайтов, где встречаются различные типы префиксов пейджера.

Кроме того здесь можно посмотреть, как выводится каждый раздел на отдельный лист.

Полная версия настройки парсера способна заходить в каждую карточку товара, собирать информацию о размерах и цветах товаров, собирать описание товара и ссылки на фотографии.

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
 __        __  _____          _____  __     __        
\ \ / / |__ / _ _ |___ | \ \ / / __ _
\ \ /\ / / / / | | | | / / \ \ / / / _` |
\ V V / / /_ | |_| | / / \ V / | (_| |
\_/\_/ /____| \__, | /_/ \_/ \__, |
|___/ |___/
Введите код, изображенный в стиле ASCII-арт.