У меня есть датафрейм:
+------+---+
| Name|Age|
+------+---+
|A-2 | 26|
|B-1 | 30|
|C-3 | 20|
+------+---+
scala> p.select("Name", "Age")
res2: org.apache.spark.sql.DataFrame = [Name: string, Age: string]
Здесь ясно видно, что данные в столбцах имеют тип String
Я хочу преобразовать столбец Name
с помощью метода split("-")
, чтобы получить только первую его часть (т. Е. A, B, C).
Но у типа Column
в spark такого метода нет, поэтому я думаю, как получить «строку» внутри столбца, чтобы я мог выполнить операцию split
.
Кто-нибудь знает, что мне делать?