Производительность при одновременном доступе к метаданным файловой системы - PullRequest
2 голосов
/ 22 ноября 2011

Мне нужно собрать определенные атрибуты файлов (дата модификации и т. Д.).Но есть много маленьких файлов для анализа.

Мой вопрос: было бы более производительным, если бы я прочитал, скажем, 3 или 4 файла одновременно?Если вы обращаетесь к файлу в Интернете, это лучше, так как вам придется ждать ответа от сервера.Но как насчет жесткого диска?Является ли параллельная стратегия более быстрой, если файлы уже кэшированы жестким диском?

1 Ответ

2 голосов
/ 22 ноября 2011

Похоже, вы обращаетесь к метаданным (mtime), которые хранятся в inode файла и, следовательно, в файловой системе.Ваш ограничивающий фактор (в терминах UNIX) должен быть системным вызовом для получения информации stat, которая может выиграть от распараллеливания.

...