Это довольно расточительно, поскольку это файлы, а не каталоги, и они гарантированно существуют в зависимости от характера задания.
Проблема здесь в том, что уровень файловой системы не знает, что такое «природа задания», поэтому время от времени выполняет свои собственные проверки
Похоже также на InMemoryFileIndex. scala довольно неэффективно; он выполняет свои собственные действия, за исключением некоторых жестко закодированных битов для HDFS, и, похоже, снова сканирует все файлы, которые он только что перечислил.
Да, возможности для совершенствования, как говорят проекты с открытым исходным кодом. Но, как правило, они говорят: «Пожалуйста, отправьте патч»