В кадре данных Spark я хочу обновить значение строки на основе других строк с таким же идентификатором.
Например, у меня есть записи ниже,
id,value
1,10
1,null
1,null
2,20
2,null
2,null
Я хочу получитьрезультат как показано ниже
id,value
1,10
1,10
1,10
2,20
2,20
2,20
Подводя итог, столбец значения может быть пустым в некоторых строках, я хочу обновить их, если есть другая строка с таким же идентификатором, которая имеет допустимое значение., Я могу просто написать предложение об обновлении с помощью inner-join, но я не нашел того же способа в Spark-sql.
update привлекает внутреннее объединение объединить объединения b на a.id = b.id set a.value = b.value (это то, как я делаю это в sql)