У меня есть такой набор данных:
data = {'Host': ['A','A','A', 'A'], 'Seq': ['0, 1, 2, 99',' 4, 5, 6', '999, 8', '100']}
df = pd.DataFrame(data)
Я хочу нормализовать все значения.
Сначала я перейду к этой форме:
host Seq
A 0
A 1
A 2
A 99
A 4
A 5
A 6
A 999
A 8
A 100
По этому коду:
df.join(df.pop('Seq')
.str.split(',',expand=True)
.stack()
.reset_index(level=1, drop=True)
.rename('Seq')).reset_index(drop=True)
После нормализации по StandartScaler:
df['Seq'] = scaler.fit_transform(np.array(df.Seq.values).reshape(-1, 1)).reshape(-1)
А теперь я не знаю, как вернуться к началу просмотра. Жду идей и комментариев