У меня есть Pandas DataFrame с несколькими столбцами.Одним из них является year
.Из этого столбца я хочу создать новый с категориальными значениями (я думаю, что термины - это сегменты), с автоматически генерируемыми сегментами.Это должно привести к чему-то подобному:
year_gr year other_cols
A (1909 - 1917) 1911 abc
B (1921 - 1930) 1923 def
C (1932 - 1941) 1935 ghi
Мне удается создать что-то близкое к этому:
year_gr = pd.cut(df.year, 10, labels=[
'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'])
df['year_gr'] = year_gr
df.head()
year_gr year other_cols
A 1911 abc
B 1923 def
C 1935 ghi
Но как мне объединить ярости, автоматически генерируемые pd.cut
, чтобымоя year_gr
переменная?Я видел, что мы можем добавить параметр retbins=True
в команду cut
для извлечения корзин, но мне не удалось его использовать ...
Спасибо!