Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Сбор информации по ссылкам на товары с сайта ozon.ru

Задача: 

Загрузить данные о товарах с сайта ozon.ru по имеющимся в таблице ссылкам

ВложениеРазмерЗагрузкиПоследняя загрузка
Настройки парсера сайта ozon.ru9.93 КБ34 дня 22 часа назад
Исходные данные 10.16 КБ0Ещё не загружался
Пример результата работы парсера в таблице Excel22.19 КБ0Ещё не загружался
Описание: 

В качестве исходных данных выступает таблица Excel, в которой в первом столбце содержатся ссылки на страницы товаров на сайте ozon.ru

Парсер обрабатывает только те строки, в которых во втором столбце пусто (ранее не обработанные), и добавляет на лист следующие столбцы:

  • Название
  • Описание
  • Категория
  • Цена
  • Ссылка на картинку (выводится в 10 столбцов)
  • Видео (выводится в 2 столбца)
  • vendor

Начиная со столбца 19 «S» и далее, парсер выводит характеристики товара, автоматически добавляя новые столбцы по мере обнаружения в карточках товаров новых характеристик:

  • Тип
  • Вид настольной игры
  • Возраст ребенка
  • Минимальное число игроков
  • Максимальное число игроков
  • Страна-изготовитель
  • Год выпуска
  • Артикул
  • Размер упаковки (ДхШхВ), см
  • Комплектация
  • Вес в упаковке, г
  • Возрастная аудитория
  • Вид детской игры
  • Материал
  • Возрастной диапазон
  • Развитие навыков
  • Упаковка
  • Автор
  • Формат издания
  • Количество страниц
  • ISBN
  • Тираж
  • Издательство
  • Переводчик
  • Переплет
  • Мелованная бумага
  • Цветные иллюстрации
  • Язык издания
  • Возрастные ограничения
  • Тип издания
  • Серия
  • Размер, см
  • Ориг.название
  • Редакторы
  • Сохранность
  • Авторы
  • Фотографы
  • Статус
  • Иллюстратор
  • Издательства
  • Переводчики
  • Редактор
  • Фотограф

 

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
  _  _             ___    ____    _____   _ 
| || | ___ ( _ ) / ___| | ____| | |
| || |_ / __| / _ \ \___ \ | _| | |
|__ _| | (__ | (_) | ___) | | |___ | |
|_| \___| \___/ |____/ |_____| |_|
Введите код, изображенный в стиле ASCII-арт.