Читайте CSV из HDF с искрой / Scala - PullRequest
0 голосов
/ 14 ноября 2018

Я использую spark 2.3.0 и hadoop 2.9.1 Я пытаюсь загрузить файл CSV, расположенный в hdfs, с помощью spark

scala> val dataframe = spark.read.format("com.databricks.spark.csv").option("header","true").schema(schema).load("hdfs://127.0.0.1:50075/filesHDFS/data.csv")

Но я получаю следующую ошибку:

2018-11-14 11:47:58 WARN  FileStreamSink:66 - Error while looking for metadata directory.
java.io.IOException: Failed on local exception: com.google.protobuf.InvalidProtocolBufferException: Protocol message end-group tag did not match expected tag.; Host Details : local host is: "Desktop-Presario-CQ42-Notebook-PC/127.0.0.1"; destination host is: "localhost":50070;

1 Ответ

0 голосов
/ 15 ноября 2018

Вместо 127.0.0.1 используйте имя FS по умолчанию. Вы можете найти его в файле core-site.xml под свойством fs.defaultFS

Это должно решить вашу проблему.

...