Я хотел бы разложить столбец данных в пандах и добавить его в качестве нового столбца. Значением столбца является строка.
, например
COL_1
'TRY A TEST'
'TRY A TEST'
'PLAY Q'
'PLAY Q'
Я хочу, чтобы оно было преобразовано в числовое значение, например:
COL_1 NEW_COL
'TRY A TEST' 0
'TRY A TEST' 0
'PLAY Q' 1
'PLAY Q' 1
Но я получил:
x = 'TRY A TEST'
my_df['NEW_COL'] = my_df['COL_1'].apply(lambda x: pd.factorize(x)[0])
(array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0], dtype=int64), array(['TRY A TEST'], dtype=object))
Кажется, что каждый символ преобразуется в число.
Я также получил ошибку:
TypeError: 'float' object is not iterable
В "COL_1" нет числа с плавающей запятой, и это строка.
Есть предложения?