Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Парсер статистики World of Tanks с сайта vbaddict.net

Задача: 

Загрузить с сайта www.vbaddict.net историю сражений WoT (около 30 тыс. записей),
и вывести в таблицу Excel:
ссылку на карту, название танка (со ссылкой), WN8, результат сражения (Won или Lost),
а также ссылку на отчёт по игре

ВложениеРазмерЗагрузкиПоследняя загрузка
Настройки парсера: vbaddict.net.xlp5.85 КБ4131 неделя 3 дня назад
Пример результата: vbaddict.net_results.xls152.5 КБ0Ещё не загружался
алгоритм работы парсера174.23 КБ6182 недели 4 дня назад
Описание: 

При запуске парсера создаётся новый файл Excel.

В результатах поиска, - десятки тысяч строк, выводимых по 20 записей на страницу.
Ссылки на страницы результатов поиска отличаются только значением параметра page=XXX (где XXX — от 1 до 1200)
Потому, исходными данными для парсера выступает массив чисел от 1 до 2000 (с запасом)

Для каждого из исходных чисел, формируется ссылка вида http://www.vbaddict.net/battlehistory.php?page=XXX&order=desc&modeid=1&a...
по которой загружается страница, и на этой странице парсер ищет все строки (по тегу TR)
Если ни одной строки на очередной странице не найдено, - парсер завершает работу
(проверка условия на равенство результата пустому значению, — если условие выполнено, то останов с параметром -9 / полный выход из парсера)

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
  _       _   _   _  _     _  _     ___       _ 
| |__ | | | | | || | | || | |_ _| __| |
| '_ \ | |_| | | || |_ | || |_ | | / _` |
| | | | | _ | |__ _| |__ _| | | | (_| |
|_| |_| |_| |_| |_| |_| |___| \__,_|
Введите код, изображенный в стиле ASCII-арт.