Во-первых, я не уверен, как вы сюда попали, потому что CSV-файл должен быть записан последовательно, что позволяет добиться лучшего ввода / вывода.Поэтому я рекомендую вам создать файл только для добавления и попытаться получить потоковые данные, такие как получение данных из binlog.
Однако, если вам нужно сделать это, я думаю, StreamingContext может вам помочь.
val ssc = new StreamingContext(new SparkConf(), Durations.milliseconds(1))
val fileStream = ssc.fileStream[LongWritable, Text, TextInputFormat]("/tmp", (x: Path) => true, newFilesOnly = false).map(_._2.toString)