Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Парсер статистики World of Tanks с сайта vbaddict.net

Задача: 

Загрузить с сайта www.vbaddict.net историю сражений WoT (около 30 тыс. записей),
и вывести в таблицу Excel:
ссылку на карту, название танка (со ссылкой), WN8, результат сражения (Won или Lost),
а также ссылку на отчёт по игре

ВложениеРазмерЗагрузкиПоследняя загрузка
Настройки парсера: vbaddict.net.xlp5.85 КБ4185 недель 5 дней назад
Пример результата: vbaddict.net_results.xls152.5 КБ0Ещё не загружался
алгоритм работы парсера174.23 КБ6225 недель 5 дней назад
Описание: 

При запуске парсера создаётся новый файл Excel.

В результатах поиска, - десятки тысяч строк, выводимых по 20 записей на страницу.
Ссылки на страницы результатов поиска отличаются только значением параметра page=XXX (где XXX — от 1 до 1200)
Потому, исходными данными для парсера выступает массив чисел от 1 до 2000 (с запасом)

Для каждого из исходных чисел, формируется ссылка вида http://www.vbaddict.net/battlehistory.php?page=XXX&order=desc&modeid=1&a...
по которой загружается страница, и на этой странице парсер ищет все строки (по тегу TR)
Если ни одной строки на очередной странице не найдено, - парсер завершает работу
(проверка условия на равенство результата пустому значению, — если условие выполнено, то останов с параметром -9 / полный выход из парсера)

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
  _____  _____             _  __  __  _    
|__ / |___ / __ _ (_) \ \/ / | | __
/ / |_ \ / _` | | | \ / | |/ /
/ /_ ___) | | (_| | | | / \ | <
/____| |____/ \__, | _/ | /_/\_\ |_|\_\
|___/ |__/
Введите код, изображенный в стиле ASCII-арт.