Попытка соединить блоки данных с CosmosDB (mongo api)
Я установил mongo_spark_connector_2_12_2_4_1.jar
и запустите приведенный ниже код.
> from pyspark.sql import SparkSession
>
> my_spark = SparkSession \
> .builder \
> .appName("myApp") \
> .getOrCreate()
>
> df = my_spark.read.format("com.mongodb.spark.sql.DefaultSource") \
> .option("uri", CONNECTION_STRING) \ .load()
CONNECTION_STRING, который выглядит так:
"MongoDB: // USERNAME: PASSWORD@testgp.documents.azure.com: 10255 / DATABASE_NAME.COLLECTION_NAME = SSL верно и replicaSet = globaldb"
К сожалению, я попал в java.lang.NoClassDefFoundError: org / bson / Conversions / Bson
Надеюсь, что удастся подключиться и выполнить запрос с помощью Pyspark.
Спасибо!