У меня есть приложение, которое реализовано в WinForms, которое обрабатывает ~ 7800 URL-адресов примерно за 5 минут (загружает URL-адрес, анализирует контент, ищет определенные фрагменты данных и, если находит то, что ищет, выполняет дополнительную обработку этогоpage.
Это конкретное приложение раньше выполнялось от 26 до 30 минут, но, изменив код на TPL (Task Parallel Library в .NET v4.0), оно запускается всего за 5 минут.рабочая станция Dell T7500 с двухъядерными процессорами Xeon (3 ГГц), работающими с 24 ГБ ОЗУ, и 64-разрядная версия Windows 7. Ultimate.
Я просто использую объекты WebClient, Stream и StreamReader в Parallel.ForEach (), и он очень быстрый.
Возможно, не точное решение, которое вы ищете, но в отличие от большинства других публикаций, которые я вижу здесь, это действительно "обрабатывает 1000 страниц в минуту" [иподробнее].
Пища для размышлений ...