Кто-нибудь знает, как удалить специальный символ из имени столбцов набора данных в Spark Java? Я хотел бы заменить "_" на "" (см. Пример ниже).
Ввод: (df_in)
+--------------+-----------------+------------+------------+
|PARTITION_DATE| date_start| dt_con_ID| dt_fin_ID|
+--------------+-----------------+------------+------------+
| 2020/03/03|2019-10-14 00:00:| 11000295001| 110100156|
Требуемый вывод: (df_out)
+--------------+-----------------+------------+------------+
|PARTITION DATE| date start| dt con ID| dt fin ID|
+--------------+-----------------+------------+------------+
| 2020/03/03|2019-10-14 00:00:| 11000295001| 110100156|
Я пытался получить эти выходные данные с кодом:
String[] colsToRename = df_in.columns();
for (String headerName : df_in.columns()) {
Dataset<Row> df_out = df_in.withColumnRenamed(headerName, headerName.replaceAll("_", " "));
df_out.show();
}
Но при этом я изменил только имя последнего столбца
+--------------+-----------------+------------+------------+
|PARTITION_DATE| date_start| dt_con_ID| dt fin ID|
+--------------+-----------------+------------+------------+
| 2020/03/03|2019-10-14 00:00:| 11000295001| 110100156|
Любая помощь, пожалуйста? Спасибо.