Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Парсер статистики World of Tanks с сайта vbaddict.net

Задача: 

Загрузить с сайта www.vbaddict.net историю сражений WoT (около 30 тыс. записей),
и вывести в таблицу Excel:
ссылку на карту, название танка (со ссылкой), WN8, результат сражения (Won или Lost),
а также ссылку на отчёт по игре

ВложениеРазмерЗагрузкиПоследняя загрузка
Настройки парсера: vbaddict.net.xlp5.85 КБ39915 недель 2 дня назад
Пример результата: vbaddict.net_results.xls152.5 КБ0Ещё не загружался
алгоритм работы парсера174.23 КБ6105 недель 1 день назад
Описание: 

При запуске парсера создаётся новый файл Excel.

В результатах поиска, - десятки тысяч строк, выводимых по 20 записей на страницу.
Ссылки на страницы результатов поиска отличаются только значением параметра page=XXX (где XXX — от 1 до 1200)
Потому, исходными данными для парсера выступает массив чисел от 1 до 2000 (с запасом)

Для каждого из исходных чисел, формируется ссылка вида http://www.vbaddict.net/battlehistory.php?page=XXX&order=desc&modeid=1&a...
по которой загружается страница, и на этой странице парсер ищет все строки (по тегу TR)
Если ни одной строки на очередной странице не найдено, - парсер завершает работу
(проверка условия на равенство результата пустому значению, — если условие выполнено, то останов с параметром -9 / полный выход из парсера)

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
  _   _   _____   _   _    ____  __        __  _____
| | | | |___ / | | | | / ___| \ \ / / |__ /
| | | | |_ \ | | | | | | _ \ \ /\ / / / /
| |_| | ___) | | |_| | | |_| | \ V V / / /_
\___/ |____/ \___/ \____| \_/\_/ /____|
Введите код, изображенный в стиле ASCII-арт.