У меня есть датафрейм с колонкой, заполненной датами выпуска фильмов. Это отформатировано как xx / xx / xx. Например 01.01.199. То, что я хочу сделать, это взять только год. Цель состоит в том, чтобы я мог построить эти данные, используя год.
Я попытался преобразовать их, используя pd.to_datetime (), и он возвращает значения, подобные 2019-01-01, что позволяет мне немного отобразить ихчище, но все-таки лучше иметь только год. Я также получаю даты, которые 01.0135 конвертируются в 2035-01-01, где они должны конвертироваться в 1935-01-01
import pandas as pd
data = pd.read_csv("train.csv")
print(data['release_date'].head())
0 2/20/15
1 8/6/04
2 10/10/14
3 3/9/12
4 2/5/09
Name: release_date, dtype: object
data['release_date'] = pd.to_datetime(data['release_date'])
print(data['release_date'].head())
0 2015-02-20
1 2004-08-06
2 2014-10-10
3 2012-03-09
4 2009-02-05
Name: release_date, dtype: datetime64[ns]
я также пытался указать параметр origin, но не могу понять, как его отформатировать вместе с параметром unit