Как указать формат даты в столбце данных - PullRequest
0 голосов
/ 02 октября 2019

У меня есть датафрейм с колонкой, заполненной датами выпуска фильмов. Это отформатировано как xx / xx / xx. Например 01.01.199. То, что я хочу сделать, это взять только год. Цель состоит в том, чтобы я мог построить эти данные, используя год.

Я попытался преобразовать их, используя pd.to_datetime (), и он возвращает значения, подобные 2019-01-01, что позволяет мне немного отобразить ихчище, но все-таки лучше иметь только год. Я также получаю даты, которые 01.0135 конвертируются в 2035-01-01, где они должны конвертироваться в 1935-01-01


import pandas as pd

data = pd.read_csv("train.csv")
print(data['release_date'].head())
0     2/20/15
1      8/6/04
2    10/10/14
3      3/9/12
4      2/5/09
Name: release_date, dtype: object

data['release_date'] = pd.to_datetime(data['release_date'])
print(data['release_date'].head())
0   2015-02-20
1   2004-08-06
2   2014-10-10
3   2012-03-09
4   2009-02-05
Name: release_date, dtype: datetime64[ns]

я также пытался указать параметр origin, но не могу понять, как его отформатировать вместе с параметром unit

1 Ответ

1 голос
/ 02 октября 2019

вариант 1:

data['release_date'] = pd.to_datetime(data['release_date']).dt.year

вариант 2:

data['release_date'] = pd.DatetimeIndex(df['release_date']).year
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...