Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Получение опций из карточки товара (размер, цвет, цена) с сайтов на Magento CMS

Задача: 

Извлечь из карточек товаров все варианты опций вида размер+цвет+цена+фото
Данные в коде страницы присутствуют в виде JSON

ВложениеРазмерЗагрузкиПоследняя загрузка
Настройки парсера (на примере сайта megamoto.ru)11.27 КБ391 неделя 6 дней назад
Пример результата работы парсера12.34 КБ0Ещё не загружался
В каком виде извлекаются данные из страницы на Magento CMS (файл .xml, смотреть в браузере)21.63 КБ0Ещё не загружался
Описание: 

На примере этого парсера вы можете посмотреть, как извлекать данные из JSON сложной структуры,
и работать с XML (выборка по XPath) для поиска размера и цвета по ID товара.

После загрузки страницы товара (третий уровень исходных действий), парсер берет JSON данные из HTML кода страницы, преобразовывает их в XML формат для дальнейшей обработки, после чего получает массив ID опций товара (каждая опция - это набор цвет+размер, со своей ценой и фото)

Для поиска цвета и размера по ID опции, в парсере присутствуют 2 набора действий,
в которых выполняется XPath запрос к XML
(обрабатываемые данные в виде XML прикреплены к статье, на примере этой страницы сайта)

Для получения цвета товара, например, используется выборка по такому XPath выражению:
//attributes/*[code="color"]/options[products="%id%"]/label/text()

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
      _   _                          _   ____  
__| | (_) _ __ ___ __ __ | | | __ )
/ _` | | | | '_ ` _ \ \ \ /\ / / | | | _ \
| (_| | | | | | | | | | \ V V / | | | |_) |
\__,_| |_| |_| |_| |_| \_/\_/ |_| |____/
Введите код, изображенный в стиле ASCII-арт.