Я создал веб-сканер в VC #. Сканер индексирует определенную информацию с сайтов .nl, перебивая все возможные адреса .nl, начиная с http://aa.nl до (теоретически) http://zzzzzzzzzzzzzzzzzzzz.nl.
Это работает нормально, за исключением того, что требуется невероятно много времени, чтобы пройти через двухбуквенные домены - aa, ab ... zz. Я подсчитал, сколько времени мне понадобится, чтобы пройти через все домены таким образом, и я получил около тысячи лет.
Я пытался ускорить это за счет многопоточности, но при одновременной работе 1300 потоков WebClient просто продолжал отказывать, что делало результирующий файл данных слишком неточным, чтобы его можно было использовать.
У меня нет доступа ни к чему другому, кроме подключения к Интернету со скоростью 5 Мбит / с, E6300 Core2duo и 2 ГБ оперативной памяти 533 @ 667 МГц на Win7.
У кого-нибудь есть идеи, что делать, чтобы сделать эту работу? Любая идея подойдет.
Спасибо