Я работаю над проектом в azure блоках данных, где мне нужно записать мои преобразованные данные в формате JSON в файл (. json), который в дальнейшем записывается в БД.
Я пробовал с фреймами данных, опциями rdd. некоторые фрагменты того, что я пробовал
df.collect.map( line => {
//transformation logic to create json
(field1,field2,json);
})
var dataframe = processedList.toList.toDF("f1","f2","json");
dataframe .repartition(1).write.mode("overwrite").json(path)
Этот код работает нормально, но значение, равное json, обрабатывается / записывается как строка так как он содержит все escape-символы et c. Не удается напрямую использовать JsonObject, так как датафрейм не поддерживает его.
Так есть ли способ записи в файл без его преобразования в строку?