Я пытаюсь создать новый столбец в наборах данных Spark на основе значения другого столбца.Значение другого столбца ищется в файле json как ключ, и возвращается его значение, которое является значением, которое будет использоваться для нового столбца.
Вот код, который я пробовал, но он не работает, и яЯ не уверен, как работает UDF.Как добавить столбец в этом случае, используя withColumn или udf?
Dataset<Row> df = spark.read().format("csv").option("header", "true").load("file path");
Object obj = new JSONParser().parse(new FileReader("json path"));
JSONObject jo = (JSONObject) obj;
df = df.withColumn("cluster", functions.lit(jo.get(df.col("existing col_name")))));
Любая помощь будет оценена.Заранее спасибо!