Дата / время в Pandas: проблема формата года при загрузке в фрейм данных pandas - PullRequest
0 голосов
/ 22 апреля 2019

У меня есть мой набор данных, как показано ниже:

Sl.No   Date1
1   08-09-1990
2   01-06-1988
3   04-10-1989
4   15-11-1991
5   01-06-1968

Когда я пытался загрузить данные:

df = pd.read_csv("file",parse_dates=True, dayfirst=True)

Я получаю вывод как:

0   08-09-90
1   01-06-88
2   04-10-89
3   15-11-91
4   01-06-68

Проблема:

  1. Формат даты дд-мм-ГГ вместо дд-мм-ГГГГ
  2. В результате, когда я пытаюсь преобразовать формат даты и времени, 1968 год принимается за 2068 (например, индекс 4 в выводе / sl.no 5 во вводе)

также по предложенной ссылке [ как указать формат даты и времени в read_csv

Я пытался, это была та же проблема, что и раньше

и я также попытался [ данные времени не соответствуют формату

DF = pd.read_csv ( "Файл", infer_datetime_format = True) df [Date1] = pd.to_datetime (df ['Date1'], формат = '% d-% m-% Y')

я столкнулся с ValueError '08 -09-90 'не соответствует формату'% d-% m-% Y '

1 Ответ

0 голосов
/ 23 апреля 2019

Дайте это попробовать - мне кажется, это работает

import pandas as pd

filepath = '' # insert your files path here (I created a csv with columns 'SI_No' and 'Date' to test this and then copied your data)

df = pd.read_csv(filepath, parse_dates=['Date'])

df = df.set_index('SI_No')

df

                Date
SI_No
1     1990-08-09
2     1988-01-06
3     1989-04-10
4     1991-11-15
5     1968-01-06
...