Имеет следующий фрейм данных (фактический фрейм данных содержит несколько строк и чисел c столбцов):
col1 col2
0 A 10
1 A 10
2 B 5
3 B 5
Я хочу нормализовать данные на основе значений столбцов, чтобы результат выглядел следующим образом:
col1 col2
0 A 0.632456
1 A 0.632456
2 B 0.316228
3 B 0.316228
А затем разбить его на группы, чтобы получить:
col1 col2
0 A 0.632456
1 A 0.632456
col1 col2
0 B 0.316228
1 B 0.316228
Разделение на группы легко, однако я борюсь с нормализацией. Я попытался использовать следующий код:
from keras.utils import normalize
df = pd.DataFrame({"col1":["A","A","B","B"],"col2":[10,10,5,5]})
normalize(df, axis=0)
Но так как у меня есть строки, он не работает, он будет работать, если значения A и B будут иметь числовое значение c.
Q : Как я могу нормализовать числовые значения c по столбцам, не удаляя строковые столбцы, чтобы впоследствии я мог сгруппировать по?