Я пытаюсь прочитать файл Excel, расположенный в HDFS. Я использую банку Spark Excel, предоставленную в https://mvnrepository.com/artifact/com.crealytics/spark-excel_2.11/0.8.3.
Код, который я написал для чтения в Excel, является
val df = spark.read.format("com.crealytics.spark.excel").option("location","hdfs/path/to/excel/file/filename.xlsx").
option("useHeader","true").option("sheetName", "Mapping").option("treatEmptyValuesAsNulls", "true").option("inferSchema", "true").option("addColorColumns", "False").load()
Но я получаю ошибку
Caused by: java.util.NoSuchElementException: key not found: 2
at scala.collection.MapLike$class.default(MapLike.scala:228)
at scala.collection.AbstractMap.default(Map.scala:59)
at scala.collection.MapLike$class.apply(MapLike.scala:141)
at scala.collection.AbstractMap.apply(Map.scala:59)
Файл Excel содержит около 10 листов. Но я должен читать только лист под названием «Картография». Лист картирования связан с другими листами с помощью VLOOKUP.
Тот же фрагмент кода работает для других простых файлов Excel (без vlookup), но не работает для этого конкретного Excel.
Может кто-нибудь, пожалуйста, помогите мне понять, в чем проблема. Есть ли какие-либо проблемы с файлом Excel, или я добавил дополнительную опцию в мой код?
Пожалуйста, прокомментируйте, если вам нужна дополнительная информация.