Как прочитать файл .xls из AWS S3, используя искру в Java?И не в состоянии прочитать sheetName - PullRequest
1 голос
/ 22 мая 2019

Я пытаюсь прочитать файл .xls из AWS S3, но получаю исключение java.io.FileNotFoundException.

Я попробовал два способа ниже.Один путем указания пути в option () с указанием расположения ключа, а другой - путем добавления того же пути в load ().

Dataset<Row> segmentConfigData = spark.read()
                .format("com.crealytics.spark.excel")
                .option("sheetName", "sheet1")
                .option("header","true")
                .option("location","s3a://input/552SegmentConfig.xls")
                .option("useHeader", "true")
                .option("treatEmptyValuesAsNulls", "true")
                .option("inferSchema", "true")
                .option("addColorColumns", "False")
                .load();

Dataset<Row> segmentConfigData = spark.read()
                .format("com.crealytics.spark.excel")
                .option("sheetName", "sheet1")
                .option("header","true")
                .option("location","s3a://input/552SegmentConfig.xls")
                .option("useHeader", "true")
                .option("treatEmptyValuesAsNulls", "true")
                .option("inferSchema", "true")
                .option("addColorColumns", "False")
                .load("s3a://input/552SegmentConfig.xls");

Я получаю файл, не найденный в качестве исключения.Точно так же, когда я читаю файл .csv, я могу прочитать файл.

Редактировать - я решил эту проблему.Я использовал более старую версию "com.crealytics.spark.excel".Я был в состоянии подготовиться, как только я распаковал банку.

Но теперь я столкнулся с другой проблемой.Я не могу прочитать любой другой лист, кроме первого.Любая помощь?

...