Парсер сайта readywork.ru - загрузка списка дипломных и курсовых работ

Задача: 

Загрузить список всех работ (название / раздел / цена / описание) с сайта readywork.ru
Данные вывести в готовый шаблон Excel для импорта в интернет-магазин на движке opencart

Описание: 

При запуске (набор действий Parser_Start) проверяется наличие открытого файла Excel, и наличие в нём листа с названием Products
(именно на этот лист будут выводиться данные). Если файл шаблона не открыт - парсер завершает работу.
Это сделано в связи со сложностью формата импортируемого файла opencart - «нормальные» таблицы Excel он, увы, не понимает.

Особенностью парсера readywork.ru является вывод части данных в столбцы, расположение которых на листе заранее не известно (речь про номер столбца)
Для этого используется режим вывода данных в найденный столбец.

Парсер заходит на главную страницу сайта, получает там список всех разделов (категорий работ), переходит по найденным ссылкам на каждую категорию, перебирает все страницы результатов, и выводит данные.

Реализована также возможность взять только часть данных (например, не все разделы, а только первые 100)
При запуске, будет выведено диалоговое окно с предложением указать диапазон номеров разделов в формате ОТ-ДО (например, можно указать 1-100, тогда будут обработаны только первые 100 разделов). Если надо обработать все категории, укажите в этом окне 1-1000 (с запасом)

Другая особенность парсера, - использование таблицы замен для преобразования названия категории в её номер
(например, "Реферат" меняется на "69", "Курсовая" — на "68", и т.д.)
Файл таблицы замен (с расширением .rt) необходимо поместить вместе с файлов настроек (.xlp) в папку НАСТРОЙКИ ПАРСЕРОВ

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
  _   _   ____     ____   _       ____   __   __
| | | | |___ \ / ___| | |__ | _ \ \ \ / /
| |_| | __) | | | _ | '_ \ | | | | \ V /
| _ | / __/ | |_| | | | | | | |_| | | |
|_| |_| |_____| \____| |_| |_| |____/ |_|
Введите код, изображенный в стиле ASCII-арт.