Если вы используете SparkContext
, возможно, вам придется использовать метод textFile
,
val data = sc.textFile(args(0))
Но мне это кажется немного странным, кажется, вы используете синтаксис SparkSession
, я Я бы предпочел SparkSession
:
import org.apache.spark.sql.SparkSession
val spark = SparkSession
.builder()
.appName("ex1")
.getOrCreate()
А вот как вы можете прочитать свой CSV
val data = spark.read.format("csv")
.option("header","true")
.option("inferSchema","true")
.load(args(0))
Вы можете проверить об этом здесь и о том, как читать CSV здесь
РЕДАКТИРОВАТЬ
Для сохранения результатов:
data.write.format("text").save(args(1))