У меня есть несколько строковых значений в одном столбце, и я хотел бы заменить подстроки в этом столбце значениями в других столбцах и заменить все знаки плюс пробелами (как показано ниже).
У меня есть эти List[String]
отображения, которые передаются динамически, где mapFrom
и mapTo
должны коррелировать в индексе.
Описание значений: mapFrom: ["Child Name", "Child Age", "Child State"]
Имена столбцов: mapTo: ["name", "age", "state"]
Пример ввода:
name, age, state, description
tiffany, 10, virginia, Child Name + Child Age + Child State
andrew, 11, california, Child State + Child Name + Child Age
tyler, 12, ohio, Child Age + Child State + Child Name
Ожидаемый результат:
name, age, state, description
tiffany, 10, virginia, tiffany 10 virginia
andrew, 11, california, california andrew 11
tyler, 12, ohio, 12 ohio tyler
Как мне добиться этого с помощью Spark Scala?