веб-сканер python с поддержкой потоков - PullRequest
2 голосов
/ 04 декабря 2009

В настоящее время я делаю какой-то скрипт для веб-сканера, но одна из проблем заключается в том, что мой интернет работает очень медленно. поэтому я подумал, возможно ли использовать веб-сканер с многопоточностью с использованием mechanize или urllib или около того. если у кого есть опыт, поделитесь информацией, очень ценю. Я искал в Google, но не нашел много полезной информации. Заранее спасибо

Ответы [ 3 ]

4 голосов
/ 04 декабря 2009

Хороший простой пример для этого потока переполнения стека.

3 голосов
/ 05 декабря 2009
1 голос
/ 04 декабря 2009

Одновременное выполнение нескольких запросов ко многим веб-сайтам, безусловно, улучшит ваши результаты, поскольку вам не нужно ждать получения результата, прежде чем отправлять новые запросы.

Однако многопоточность - это только один из способов сделать это (и я бы добавил, плохой). Не используйте потоки для этого. Только не ждите ответа, прежде чем отправлять другой запрос! Для этого не нужно создавать потоки.

Хорошая идея - использовать scrapy . Это быстрый высокоуровневый фреймворк для сканирования экрана и веб-сканирования, используемый для сканирования веб-сайтов и извлечения структурированных данных из их страниц . Он написан на python и может одновременно выполнять много подключений для извлечения данных (без использования потоков). Это действительно быстро. Вы также можете изучить его, чтобы увидеть, как оно реализовано.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...