Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Загрузка веб-страниц в несколько потоков (многопоточность в парсере сайтов)

Задача: 

Загрузить в Excel все товары с сайта туристических товаров.
Скачать все фото товаров, присвоив им новые имена.
Для ускорения процесса, парсинг должен идти в несколько потоков.

ВложениеРазмерЗагрузкиПоследняя загрузка
Настройки парсера с использованием многопоточности16.9 КБ5992 недели 1 день назад
Пример результата в таблице Excel112.26 КБ0Ещё не загружался
Описание: 

Алгоритм настройки парсера ничем особо не отличается от настройки под другие сайты,
но, в данном парсере, применена многопоточная загрузка (на 3 уровне исходных данных).

Парсер может использовать до 100-150 потоков, но в данной настройке количество потоков ограничено значением 15 (если сделать больше, - сайт вместо некоторых страниц выдает сообщение об ошибке)

Простой пример использования многопоточности можно посмотреть на вкладке «Дополнительно / Наборы действий» этого парсера.
Там есть набор действий TEST из 4 действий: первые 3 действия загрузают страницу раздела сайта, и находят на ней около 40 гиперссылок,
а четвёртое действие (многопоточная загрузка) за несколько секунд прогружает все эти 40 URL, и на выходе мы имеет массив из 40 исходных кодов веб-страниц.

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
          _      ____   __  __  __   __  ____  
__ _ | |_ / ___| | \/ | \ \ / / | _ \
/ _` | | __| | | _ | |\/| | \ V / | |_) |
| (_| | | |_ | |_| | | | | | | | | __/
\__, | \__| \____| |_| |_| |_| |_|
|___/
Введите код, изображенный в стиле ASCII-арт.