Я использую AWS EMR на работе. Если я запускаю оболочку spark, я могу запускать команды scala, но не могу читать в локальном файле.
Например:
scala> val citi = spark.read.textFile("CitiGroup2006")
org.apache.spark.sql.AnalysisException: Path does not exist: hdfs://ip-10-99-99-99.ec2.internal:8020/user/hadoop/CitiGroup2006;
Я попытался ввести полный путь к файлу, но получаю ту же ошибку. Файл находится в том же каталоге, где я запустил оболочку spark. Однако он работает для загрузки scala файла
:load hello.scala
Почему «загрузка» работает, а не spark.read.textFile?