Ошибка в Spark при чтении в Excel: org.apache.poi.openxml4j.exceptions.InvalidFormatException - PullRequest
0 голосов
/ 02 апреля 2019

Я пытаюсь прочитать файл Excel с помощью Spark CLI, но получаю сообщение об ошибке «org.apache.poi.openxml4j.exceptions.InvalidFormatException: ваш InputStream не был ни потоком OLE2, ни потоком OOXML».

Ниже приведены данные, представленные в моем листе Excel:

Id  Name    City
1   Amit    Panji
2   Sharma  Mumbai
3   Kumar   Pune
4   Abhay   Delhi
5   Rohit   Gurgaon

Ниже код, который я использую:

    import com.crealytics.spark.excel

    val df = spark.read.format("com.crealytics.spark.excel")
    .option("useHeader", "true")
    .option("startColumn", 0)
    .option("treatEmptyValuesAsNulls", "false")
    .option("inferSchema", "false")
    .option("location", "/home/Desktop/lucky/logs.xlsx")
    .option("addColorColumns", "False")
    .load()

1 Ответ

0 голосов
/ 02 апреля 2019

Какую версию Excel вы используете?

Сайт Apache POI сообщает:

Apache POI is your Java Excel solution (for Excel 97-2008)

Сайт Apache POI: https://poi.apache.org/

...