Одна, возможно, интересная вещь, которую вы могли бы сделать, это использовать gnu параллельно: http://www.gnu.org/s/parallel/ Например, если вы делали паузы на сайтах:
stackoverflow.com, stackexchange.com, fogcreek.com
Вы могли бы сделать что-то вроде этого
(echo stackoverflow.com; echo stackexchange.com; echo fogcreek.com) | parallel -k your_spider_script
и выходные данные буферизуются параллельно и из-за опции -k, возвращенной вам в порядке списка сайтов выше. Реальный пример (в основном скопированный из 2-го параллельного экрана):
~ $ (echo stackoverflow.com; echo stackexchange.com; echo fogcreek.com) | parallel -k ping -c 1 {}
PING stackoverflow.com (64.34.119.12): 56 data bytes
--- stackoverflow.com ping statistics ---
1 packets transmitted, 0 packets received, 100.0% packet loss
PING stackexchange.com (64.34.119.12): 56 data bytes
--- stackexchange.com ping statistics ---
1 packets transmitted, 0 packets received, 100.0% packet loss
PING fogcreek.com (64.34.80.170): 56 data bytes
64 bytes from 64.34.80.170: icmp_seq=0 ttl=250 time=23.961 ms
--- fogcreek.com ping statistics ---
1 packets transmitted, 1 packets received, 0.0% packet loss
round-trip min/avg/max/stddev = 23.961/23.961/23.961/0.000 ms
В любом случае, мммм