mail mail
Нужен макрос для Excel?
Сделайте заказ прямо сейчас!
Ищете готовое решение?
Выбирайте и покупайте!
У вас есть интернет-магазин?
Настроим парсер под любой сайт!

Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Работа с таблицами в "Парсере сайтов" на примере парсинга контента сайта smartbuy-russia.ru

Задача: 

Спарсить информацию о товарах с сайта, при этом преобразовать таблицу характеристик с разными артикулами товара (см. скриншот) в отдельные строки выгрузки.

ВложениеРазмерЗагрузкиПоследняя загрузка
Образец выгрузки парсером данных с сайта smartbuy-russia.ru в формате Эксель15.46 КБ0Ещё не загружался
Настройки парсера для сбора информации с сайта smartbuy-russia.ru14.26 КБ751 неделя 4 дня назад
Описание: 

Данная настройка будет прежде всего интересна тем людям, кто настраивает парсеры самостоятельно. В тестовой настройке показано, как можно преобразовывать вертикальные таблицы в коде HTML в строки выгрузки. Вводится счетчик столбцов и в дополнительном наборе действий извлекается элемент массива под номером счетчика, таким образом мы получаем нужный нам столбец.

В остальном настройка достаточно стандартна. Выводятся столбцы:

Раздел
Артикул (значение из первой строки таблиц с характеристиками)
Наименование (собственно наименование товара плюс артикул)
Описание 1 (справа от фотографии)
Описание 2 (над таблицей)

Остальные столбцы берутся из таблицы с характеристиками и формируются динамическим способом.

Подобный принцип работы с таблицами может быть применен на любом сайте с подобными таблицами.

Настройка "горизонтальных" таблиц, где каждый артикул и его характеристики расположены в строке, а не в столбце, делается проще - на выходе обработки исходных действий передается тег tr на обработку и можно обойтись без дополнительных наборов действий.

Полный комплект настроек для данного сайта включает в себя 2 настройки - одна для разделов сайта, где встречаются "вертикальные" таблицы, другая - для тех разделов, где "горизонтальные" таблицы.

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
  _   _____   _  __                     _  __
| | |___ / | |/ / __ __ __ __ | |/ /
| | |_ \ | ' / \ \ /\ / / \ \ / / | ' /
| | ___) | | . \ \ V V / \ V / | . \
|_| |____/ |_|\_\ \_/\_/ \_/ |_|\_\
Введите код, изображенный в стиле ASCII-арт.