У меня есть приложение Spark Streaming, которое записывает свои выходные данные в HDFS.
Какие меры предосторожности и стратегии можно предпринять, чтобы этот процесс не создавал слишком много мелких файлов и создавал нагрузку на память в HDFS Namenode.Имеет ли Apache Spark какие-либо готовые решения, позволяющие избежать мелких файлов в HDFS.