Я новичок в Spark и примеряю руки. В настоящее время у меня есть схема, с помощью которой я загружаю данные json в Spark. Структура JSON выглядит следующим образом:
{
"value1": 345.2
"value2": 32
}
Я использую следующую схему для чтения этой структуры json:
val myJsonschema = StructType(
Array(
StructField("value1", StringType)
StructField("value2", StringType)
)
)
Я применяю схему как:
val dataFrame_val1_val2 = myDataStream.select(from_json(col("value").cast("string"), myJsonschema).as("data"))
Однако, когда я проверяю содержимое dataFrame_val1_val2
, я получаю двойные значения как {"$numberDouble":"345.2"}
вместо просто 345.2
. Для целых чисел работает нормально.
Что мне здесь не хватает?