Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Получение опций из карточки товара (размер, цвет, цена) с сайтов на Magento CMS

Задача: 

Извлечь из карточек товаров все варианты опций вида размер+цвет+цена+фото
Данные в коде страницы присутствуют в виде JSON

ВложениеРазмерЗагрузкиПоследняя загрузка
Настройки парсера (на примере сайта megamoto.ru)11.27 КБ763 недели 7 часов назад
Пример результата работы парсера12.34 КБ0Ещё не загружался
В каком виде извлекаются данные из страницы на Magento CMS (файл .xml, смотреть в браузере)21.63 КБ0Ещё не загружался
Описание: 

На примере этого парсера вы можете посмотреть, как извлекать данные из JSON сложной структуры,
и работать с XML (выборка по XPath) для поиска размера и цвета по ID товара.

После загрузки страницы товара (третий уровень исходных действий), парсер берет JSON данные из HTML кода страницы, преобразовывает их в XML формат для дальнейшей обработки, после чего получает массив ID опций товара (каждая опция - это набор цвет+размер, со своей ценой и фото)

Для поиска цвета и размера по ID опции, в парсере присутствуют 2 набора действий,
в которых выполняется XPath запрос к XML
(обрабатываемые данные в виде XML прикреплены к статье, на примере этой страницы сайта)

Для получения цвета товара, например, используется выборка по такому XPath выражению:
//attributes/*[code="color"]/options[products="%id%"]/label/text()

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
   ____   _           _           _   _         
/ ___| | |__ __| | _ __ | \ | | _ _
| | _ | '_ \ / _` | | '_ \ | \| | | | | |
| |_| | | |_) | | (_| | | | | | | |\ | | |_| |
\____| |_.__/ \__,_| |_| |_| |_| \_| \__,_|
Введите код, изображенный в стиле ASCII-арт.