Парсер сайта readywork.ru - загрузка списка дипломных и курсовых работ

Задача: 

Загрузить список всех работ (название / раздел / цена / описание) с сайта readywork.ru
Данные вывести в готовый шаблон Excel для импорта в интернет-магазин на движке opencart

Описание: 

При запуске (набор действий Parser_Start) проверяется наличие открытого файла Excel, и наличие в нём листа с названием Products
(именно на этот лист будут выводиться данные). Если файл шаблона не открыт - парсер завершает работу.
Это сделано в связи со сложностью формата импортируемого файла opencart - «нормальные» таблицы Excel он, увы, не понимает.

Особенностью парсера readywork.ru является вывод части данных в столбцы, расположение которых на листе заранее не известно (речь про номер столбца)
Для этого используется режим вывода данных в найденный столбец.

Парсер заходит на главную страницу сайта, получает там список всех разделов (категорий работ), переходит по найденным ссылкам на каждую категорию, перебирает все страницы результатов, и выводит данные.

Реализована также возможность взять только часть данных (например, не все разделы, а только первые 100)
При запуске, будет выведено диалоговое окно с предложением указать диапазон номеров разделов в формате ОТ-ДО (например, можно указать 1-100, тогда будут обработаны только первые 100 разделов). Если надо обработать все категории, укажите в этом окне 1-1000 (с запасом)

Другая особенность парсера, - использование таблицы замен для преобразования названия категории в её номер
(например, "Реферат" меняется на "69", "Курсовая" — на "68", и т.д.)
Файл таблицы замен (с расширением .rt) необходимо поместить вместе с файлов настроек (.xlp) в папку НАСТРОЙКИ ПАРСЕРОВ

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
  _____   ____        _    ___        _    ____ 
| ___| |___ \ | | / _ \ __| | / ___|
| |_ __) | _ | | | (_) | / _` | | | _
| _| / __/ | |_| | \__, | | (_| | | |_| |
|_| |_____| \___/ /_/ \__,_| \____|
Введите код, изображенный в стиле ASCII-арт.