Что касается вашей второй части вопроса, вы можете объединять файлы (используя mergeContent) на основе атрибута 'kafka.topic'.Таким образом, вы можете объединить контент разных тем, используя один процессор.(Данные каждой темы будут объединены только с данными этой конкретной темы)
Затем вы можете направить файлы в разные каталоги в HDFS, указав путь как "hdfs: // $ {your-hdfs-путь} / $ {kafka.topic} "
Дайте мне знать, если вам нужна дополнительная помощь!