К сожалению, нет настраиваемого способа предотвратить это. Каждое задание для задания получает один каталог в history / userlogs, в котором будут храниться выходные файлы журнала задач stdout, stderr и syslog. Время хранения поможет предотвратить накопление слишком многих из них, но вам придется написать хороший инструмент ротации журналов, чтобы автоматически их изменять.
У нас тоже была эта проблема при записи в монтирование NFS, потому что все узлы имели бы общий каталог history / userlogs. Это означает, что одной работы с 30000 задач будет достаточно, чтобы сломать FS. Локальное ведение журнала - это действительно тот путь, когда ваш кластер фактически начинает обрабатывать много данных.
Если вы уже регистрируетесь локально и по-прежнему можете обрабатывать более 30 000 задач на одном компьютере менее чем за неделю, то вы, вероятно, создаете слишком много небольших файлов, что приводит к появлению слишком большого числа сопоставителей для каждой работы.