чтение файла Excel (*. xlsx) с использованием scala и spark-sql - PullRequest
0 голосов
/ 02 июля 2018

Я пытаюсь прочитать файл Excel, расположенный в HDFS. Я использую банку Spark Excel, предоставленную в https://mvnrepository.com/artifact/com.crealytics/spark-excel_2.11/0.8.3.

Код, который я написал для чтения в Excel, является

val df = spark.read.format("com.crealytics.spark.excel").option("location","hdfs/path/to/excel/file/filename.xlsx").
option("useHeader","true").option("sheetName", "Mapping").option("treatEmptyValuesAsNulls", "true").option("inferSchema", "true").option("addColorColumns", "False").load()

Но я получаю ошибку

Caused by: java.util.NoSuchElementException: key not found: 2
  at scala.collection.MapLike$class.default(MapLike.scala:228)
  at scala.collection.AbstractMap.default(Map.scala:59)
  at scala.collection.MapLike$class.apply(MapLike.scala:141)
  at scala.collection.AbstractMap.apply(Map.scala:59)

Файл Excel содержит около 10 листов. Но я должен читать только лист под названием «Картография». Лист картирования связан с другими листами с помощью VLOOKUP. Тот же фрагмент кода работает для других простых файлов Excel (без vlookup), но не работает для этого конкретного Excel.

Может кто-нибудь, пожалуйста, помогите мне понять, в чем проблема. Есть ли какие-либо проблемы с файлом Excel, или я добавил дополнительную опцию в мой код?

Пожалуйста, прокомментируйте, если вам нужна дополнительная информация.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...