Я пытаюсь прочитать файл Excel с помощью Spark CLI, но получаю сообщение об ошибке «org.apache.poi.openxml4j.exceptions.InvalidFormatException: ваш InputStream не был ни потоком OLE2, ни потоком OOXML».
Ниже приведены данные, представленные в моем листе Excel:
Id Name City
1 Amit Panji
2 Sharma Mumbai
3 Kumar Pune
4 Abhay Delhi
5 Rohit Gurgaon
Ниже код, который я использую:
import com.crealytics.spark.excel
val df = spark.read.format("com.crealytics.spark.excel")
.option("useHeader", "true")
.option("startColumn", 0)
.option("treatEmptyValuesAsNulls", "false")
.option("inferSchema", "false")
.option("location", "/home/Desktop/lucky/logs.xlsx")
.option("addColorColumns", "False")
.load()