Спарсить информацию о товарах с сайта, при этом преобразовать таблицу характеристик с разными артикулами товара (см. скриншот) в отдельные строки выгрузки.
Данная настройка будет прежде всего интересна тем людям, кто настраивает парсеры самостоятельно. В тестовой настройке показано, как можно преобразовывать вертикальные таблицы в коде HTML в строки выгрузки. Вводится счетчик столбцов и в дополнительном наборе действий извлекается элемент массива под номером счетчика, таким образом мы получаем нужный нам столбец.
В остальном настройка достаточно стандартна. Выводятся столбцы:
Раздел
Артикул (значение из первой строки таблиц с характеристиками)
Наименование (собственно наименование товара плюс артикул)
Описание 1 (справа от фотографии)
Описание 2 (над таблицей)
Остальные столбцы берутся из таблицы с характеристиками и формируются динамическим способом.
Подобный принцип работы с таблицами может быть применен на любом сайте с подобными таблицами.
Настройка "горизонтальных" таблиц, где каждый артикул и его характеристики расположены в строке, а не в столбце, делается проще - на выходе обработки исходных действий передается тег tr на обработку и можно обойтись без дополнительных наборов действий.
Полный комплект настроек для данного сайта включает в себя 2 настройки - одна для разделов сайта, где встречаются "вертикальные" таблицы, другая - для тех разделов, где "горизонтальные" таблицы.
Комментарии
Отправить комментарий