У меня есть датафрейм. Многие имена столбцов имеют не ASCII символы и специальные символы like (), /, +,. (не точки ascii в середине) et c и пространства не ascii . Этого не произошло при чтении CSV . Это произошло из-за горячего кодирования. (когда я преобразовал свою категориальную переменную в цифру c столбцы и значения категорий имели значения не ascii)
df
Col1/name Col 2() name Col3 + name Col4 ^¨ name etc...
Ожидаемый вывод
Мне нужны только цифры, подчеркивания и символы в именах моих столбцов (я хочу изменить только столбец имена не имеют значения в кадре или строках). Это необходимо, потому что некоторые алгоритмы машинного обучения, такие как lightGBM, не работают с не ASCII-символами или не ASCII-пробелами в именах столбцов.
Ожидаемый вывод df:
Col1name Col_2_name Col3__name Col4__name etc...
Таким образом, заменив пробел подчеркиванием и удалив любые нечислительные c и не символьные в именах столбцов.