Question

Я создал приложение, которое выполняет работу с тысячами файлов, а затем записывает измененные копии этих файлов на диск.Я использую ThreadPool, но он порождал так много потоков, что ПК становился не отвечающим на 260 (всего), поэтому я изменил макс с 250 по умолчанию на 50, это решило эту проблему (приложение порождает всего около 60 потоков)теперь, когда файлы готовятся так быстро, это связывает пользовательский интерфейс до точки, когда компьютер не отвечает.

Есть ли способ ограничить количество операций ввода-вывода - я имею в виду, мне нравится использовать 50потоки для выполнения работы с файлами, но не 50 потоков, пишущих одновременно, когда они обрабатываются.Я бы предпочел не переделывать архитектуру части файлов, если я могу от нее отказаться - я надеялся, что смогу ограничить количество операций ввода-вывода (одновременных), которые могут потреблять потоки из этого пула.

Muhammad Hasan Khan · Answer 1 · 04 августа 2010

Используйте семафор, чтобы ограничить номер. потоков, желающих записать на диск одновременно.

http://msdn.microsoft.com/en-us/library/system.threading.semaphore.aspx

Ограничивает количество потоков, которые могут получить доступ к ресурсу или пулу ресурсов одновременно.

Tim Lloyd · Answer 2 · 04 августа 2010

Вам действительно не нужно так много потоков.Диск может поддерживать только максимальную пропускную способность чтения и записи, которую может легко максимизировать один поток, если он предназначен для ввода-вывода, то есть для чтения или записи.Вы также не можете одновременно читать и записывать на жесткий диск (хотя это сложно с уровнями кэширования ОС и т. Д.), Поэтому одновременное чтение и запись потоков может быть очень непродуктивным.Также мало что можно получить от наличия большего количества потоков, чем процессоров \ ядер для ваших задач, не связанных с вводом-выводом, поскольку любые дополнительные потоки будут тратить большую часть своего времени на ожидание доступности ядра, например, если у вас 50 потоков и 4 ядра, минимумиз 46 потоков будут простаивать в любой момент времени.Потраченные впустую потоки будут способствовать как расходу памяти, так и снижению производительности, поскольку они все время будут бороться за трещину в ядре, и ОС вынуждена решать эту битву.

Более простой подход будетиметь один поток, чье задание читать в файлах, а затем добавлять данные в очередь блокировки (например, см. ConcurrentQueue ), в то же время иметь ряд рабочих потоков, ожидающих данных файла вочередь (например, число потоков, равное количеству процессоров \ ядер).Эти рабочие потоки пробираются через очередь при добавлении элементов и блокируются, когда она пуста.Когда рабочий поток завершает часть работы, он может добавить ее в другую очередь блокировки, которая отслеживается либо потоком чтения, либо выделенным потоком записи.Его работа заключается в том, чтобы записывать файлы.

Этот шаблон стремится сбалансировать ввод-вывод и ЦП среди гораздо меньшего количества взаимодействующих потоков, где количество потоков ввода-вывода ограничено тем, что физически возможно жесткимдиск, и количество рабочих потоков процессора, которое разумно для числа процессоров \ ядер, которые у вас есть.По сути, он разделяет работу ввода-вывода и процессора, так что все ведет себя более предсказуемо.

В дополнение к этому, если IO действительно является проблемой (а не огромным количеством потоков, все сражаются друг с другом), то вы можете сделать несколько пауз (например, Thread.Sleep) в своем файле, читая и записывая потоки вограничить, сколько работы они делают.

Обновление

Возможно, стоит объяснить, почему в первую очередь генерируется так много потоков.Это дегенеративный случай использования пула потоков, и он сосредоточен вокруг очередей рабочих элементов, в которых есть компонент ввода-вывода.

Пул потоков выполняет рабочие элементы из своей очереди и отслеживает, сколько времени занимает выполнение рабочих элементов.Если выполняющиеся в настоящее время рабочие элементы занимают много времени (я думаю, что полсекунды из памяти), то он начнет добавлять больше потоков в пул, поскольку полагает, что это сделает обработку очереди более справедливой \ более справедливой.Однако если дополнительные параллельные рабочие элементы также выполняют операции ввода-вывода с общим диском, производительность диска фактически снижается, а это означает, что выполнение рабочих элементов займет еще больше времени.Поскольку рабочие элементы выполняются дольше, пул потоков добавляет больше потоков.Это дегенеративный случай, когда производительность становится все хуже и хуже по мере добавления большего количества потоков.

Использование семафора, как предлагается, должно быть сделано осторожно, так как семафор может вызвать блокировку потоков пула потоков, пула потоковувидит, что выполнение рабочих элементов займет много времени, и он все равно начнет добавлять больше потоков.

Могу ли я ограничить ввод / вывод моего приложения C #

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Могу ли я ограничить ввод / вывод моего приложения C #

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов