Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Получение опций из карточки товара (размер, цвет, цена) с сайтов на Magento CMS

Задача: 

Извлечь из карточек товаров все варианты опций вида размер+цвет+цена+фото
Данные в коде страницы присутствуют в виде JSON

ВложениеРазмерЗагрузкиПоследняя загрузка
Настройки парсера (на примере сайта megamoto.ru)11.27 КБ191 день 10 часов назад
Пример результата работы парсера12.34 КБ0Ещё не загружался
В каком виде извлекаются данные из страницы на Magento CMS (файл .xml, смотреть в браузере)21.63 КБ0Ещё не загружался
Описание: 

На примере этого парсера вы можете посмотреть, как извлекать данные из JSON сложной структуры,
и работать с XML (выборка по XPath) для поиска размера и цвета по ID товара.

После загрузки страницы товара (третий уровень исходных действий), парсер берет JSON данные из HTML кода страницы, преобразовывает их в XML формат для дальнейшей обработки, после чего получает массив ID опций товара (каждая опция - это набор цвет+размер, со своей ценой и фото)

Для поиска цвета и размера по ID опции, в парсере присутствуют 2 набора действий,
в которых выполняется XPath запрос к XML
(обрабатываемые данные в виде XML прикреплены к статье, на примере этой страницы сайта)

Для получения цвета товара, например, используется выборка по такому XPath выражению:
//attributes/*[code="color"]/options[products="%id%"]/label/text()

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
  _____   _____   ____    _  _     _   ____  
|_ _| |___ | |___ \ | || | (_) | __ )
| | / / __) | | || |_ | | | _ \
| | / / / __/ |__ _| | | | |_) |
|_| /_/ |_____| |_| |_| |____/
Введите код, изображенный в стиле ASCII-арт.