Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Парсер сайта gal-art.pl - поиск по артикулу

Задача: 

По артикулу товара из столбца «B», найти на сайте gal-art.pl страницу товара,
и получить с неё данные по количеству и цене товара.

В отдельные столбцы вывести название и описание товара со страницы товара, переведя их на русский язык.
Скачать изображение товара, присвоив файлу имя из столбца «A», и поместить в подпапку с названием категории товара из столбца «I».
В столбец «G» вставить гиперссылку на страницу товара на сайте.

ВложениеРазмерЗагрузкиПоследняя загрузка
gal-art.pl_.xlsb58.96 КБ8448 недель 5 дней назад
gal-art.pl.xlp5.94 КБ4456 недель 3 дня назад
gal-art-algorithm.html472.38 КБ6922 недели 4 дня назад
Описание: 

Описание алгоритма парсера - в прикреплённом HTML файле

Комментарии

Получилось, спасибо!

Всё можно прописать.
в результате выполнения действий в разделе «загрузка» должна получиться не одна ссылка на картинку, а МАССИВ ссылок на картинки
Задаёте на вкладке ИМЯ ФАЙЛА режим «по маске», и прописываете маску типа {1}_{item_index}.jpg
где {1} - это данные из первого столбца, а вместо {item_index} программа подставит порядковый номер ссылки (от 1 до количества картинок)

Спасибо за предложение! Вроде пока разобралась. Только не понимаю, как прописать чтобы несколько картинок товара скачивалось. Можно прописать номер вхождения блока текста?

Могу показать, как настраивается, на примере одного сайта
От вас для этого надо: http://ExcelVBA.ru/help

Спасибо, но под заказ не надо! Буду сама разбираться, т.к. сайтов-доноров много. Если получится - куплю лицензию, нет - буду искать другой парсер.

В вашем случае надо найти на сайте список всех товаров,
и потом перебрать все товары, и по каждому вывести результат в таблицу.

К описанному в этой статье примеру, ваша задача отношения не имеет (здесь - другая задача, когда подставляются данные в существующие строки,
а вам надо формировать таблицу с нуля)

Можем настроить под заказ (стоимость настройки около 1500 руб, в зависимости от сложности сайта)
Итого, получите готовое решение за 4 т.р. (стоимость лицензии на программу + стоимость настройки)

Добрый день!
Заинтересовал Ваш парсер, разбираюсь. Возник вопрос - как настроить загрузку данных о товарах с сайта, если известно что все товары находятся на страницах формата адрес_сайта/katalog/031-994, где 031-994 это артикул товара, он может быть также вида 555-555-55, 555-55 и т.д. Перечня артикулов нет, прайса нет.

Уважаемый Автор. Да если бы, были деньги, даже не раздумывая заплатил. Остается один вопрос, как сделать чтобы он из страницы брал не первый найденный результат постоянно, а двигался дальше.

Здравствуйте, Сергей
С какого сайта вытаскивать эти значения, и почему именно эти, а не другие, - я должен догадаться?

Обычно парсить сайты автозапчастей заметно сложнее, чем сайты с другими товарами
Потому, такие настройки - только под заказ, от 1000 рублей
Нужно видеть, что является исходными данными для поиска, куда и в каком виде выводить результат (нужен пример в виде файла Excel)

Доброе время, проконсультируйте пожалуйста - как настроить чтобы вытаскивать эти значения?

Показать все запчасти для этой модели
  • Передние фары
  • ФАРА ПРАВАЯ (оригинал) ПОД КОРРЕКТОР
    Артикул запчасти: FD-8017

    Год автомобиля: 2006 - по настоящее время
    Оригинальный номер: 2601095F0E

    9 267 руб.

    Виталик, в каком виде вы хотели бы получить ответ?
    У меня есть только один вариант ответа: «Настроить программу-парсер, и запустить её»
    Сколько конкретики в вопросе - столько и в ответе)

    Если нужно готовое решение - высылайте мне на почту пример результата в виде файла Excel,
    и описывайте, с какого сайта из каких разделов что надо брать.

    Как скачать с сайта каталог машин, модель, марка, год, двигатель.

    Добрый день, как выполнить авторизацию https ?

    Почему не сможет... всё можно настроить
    Для программы нет особой разницы, используется https или http
    И авторизацию можно выполнить

    Добрый день, с сайта https// с авторизаций (логин пароль) не сможет брать данные?

    Отправить комментарий

    Содержание этого поля является приватным и не предназначено к показу.
    CAPTCHA
    Подтвердите, пожалуйста, что вы - человек:
      _        ___     __               _            
    | |__ ( _ ) / _| _ __ ___ | | ___
    | '_ \ / _ \ | |_ | '_ ` _ \ | | / _ \
    | |_) | | (_) | | _| | | | | | | | |___ | __/
    |_.__/ \___/ |_| |_| |_| |_| |_____| \___|
    Введите код, изображенный в стиле ASCII-арт.