Ошибка: запись в непустую коллекцию - PullRequest
0 голосов
/ 25 апреля 2019

У меня возникла проблема при записи json в мою базу данных Cosmos.Я мог читать данные и иметь проблемы при написании того же

Применяемой следующей версии разъемов Cosmos db https://docs.azuredatabricks.net/spark/latest/data-sources/azure/cosmosdb-connector.html и пробовал разные версии.Проблема остается нерешенной.

RawFilePath="/mnt/ADLS/Users/test/CosmosDB/testfile.json"
DFRead=spark.read.json(RawFilePath)
DFNew = DFRead.selectExpr("activity", "partition AS xfactor","response", "source", "type")

writeConfig  = {
 "Endpoint" : "{End Point}",
 "Masterkey" : "{MasterKey}",
 "Database" : "{DB Name}",
 "Collection" : "{Connection name}",
 "Upsert" : "true"   
}

DFNew.write.format("com.microsoft.azure.cosmosdb.spark").options(**writeConfig).save()

Получение следующей ошибки.

Error : java.lang.UnsupportedOperationException: Writing in a non-empty collection.

Ожидается запись json в коллекцию космических БД.Но не удалось устранить непустую ошибку коллекции в Databricks.Очень ценю вашу помощь.

спасибо ..

1 Ответ

0 голосов
/ 28 мая 2019

Попробуйте, указав режим

DFNew.write.format("com.microsoft.azure.cosmosdb.spark").mode("append").options(**writeConfig).save()
...