Статья является примером использования программы «Парсер сайтов и файлов» для сбора данных с веб-страниц

Инструкция по добавлению файла настроек в программу

Загрузка веб-страниц в несколько потоков (многопоточность в парсере сайтов)

Задача: 

Загрузить в Excel все товары с сайта туристических товаров.
Скачать все фото товаров, присвоив им новые имена.
Для ускорения процесса, парсинг должен идти в несколько потоков.

ВложениеРазмерЗагрузкиПоследняя загрузка
Настройки парсера с использованием многопоточности16.9 КБ5564 дня 19 часов назад
Пример результата в таблице Excel112.26 КБ0Ещё не загружался
Описание: 

Алгоритм настройки парсера ничем особо не отличается от настройки под другие сайты,
но, в данном парсере, применена многопоточная загрузка (на 3 уровне исходных данных).

Парсер может использовать до 100-150 потоков, но в данной настройке количество потоков ограничено значением 15 (если сделать больше, - сайт вместо некоторых страниц выдает сообщение об ошибке)

Простой пример использования многопоточности можно посмотреть на вкладке «Дополнительно / Наборы действий» этого парсера.
Там есть набор действий TEST из 4 действий: первые 3 действия загрузают страницу раздела сайта, и находят на ней около 40 гиперссылок,
а четвёртое действие (многопоточная загрузка) за несколько секунд прогружает все эти 40 URL, и на выходе мы имеет массив из 40 исходных кодов веб-страниц.

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
Подтвердите, пожалуйста, что вы - человек:
  _       _   _  _              ____   _   _ 
| | / | | || | __ _ / ___| | \ | |
| | | | | || |_ / _` | | | | \| |
| |___ | | |__ _| | (_| | | |___ | |\ |
|_____| |_| |_| \__, | \____| |_| \_|
|_|
Введите код, изображенный в стиле ASCII-арт.