Парсер сайта readywork.ru - загрузка списка дипломных и курсовых работ

Задача: 

Загрузить список всех работ (название / раздел / цена / описание) с сайта readywork.ru
Данные вывести в готовый шаблон Excel для импорта в интернет-магазин на движке opencart

Описание: 

При запуске (набор действий Parser_Start) проверяется наличие открытого файла Excel, и наличие в нём листа с названием Products
(именно на этот лист будут выводиться данные). Если файл шаблона не открыт - парсер завершает работу.
Это сделано в связи со сложностью формата импортируемого файла opencart - «нормальные» таблицы Excel он, увы, не понимает.

Особенностью парсера readywork.ru является вывод части данных в столбцы, расположение которых на листе заранее не известно (речь про номер столбца)
Для этого используется режим вывода данных в найденный столбец.

Парсер заходит на главную страницу сайта, получает там список всех разделов (категорий работ), переходит по найденным ссылкам на каждую категорию, перебирает все страницы результатов, и выводит данные.

Реализована также возможность взять только часть данных (например, не все разделы, а только первые 100)
При запуске, будет выведено диалоговое окно с предложением указать диапазон номеров разделов в формате ОТ-ДО (например, можно указать 1-100, тогда будут обработаны только первые 100 разделов). Если надо обработать все категории, укажите в этом окне 1-1000 (с запасом)

Другая особенность парсера, - использование таблицы замен для преобразования названия категории в её номер
(например, "Реферат" меняется на "69", "Курсовая" — на "68", и т.д.)
Файл таблицы замен (с расширением .rt) необходимо поместить вместе с файлов настроек (.xlp) в папку НАСТРОЙКИ ПАРСЕРОВ

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
   ___    _____   ___  __   __  _____  __  __
/ _ \ | ____| |_ _| \ \ / / | ____| \ \/ /
| (_) | | _| | | \ V / | _| \ /
\__, | | |___ | | | | | |___ / \
/_/ |_____| |___| |_| |_____| /_/\_\
Введите код, изображенный в стиле ASCII-арт.