Как обойти ошибку Python Pandas DataFrame «вне границы наносекундной метки времени»? - PullRequest
0 голосов
/ 10 мая 2018

Следующий код выдает ошибку «Out of bounds nanosecond timestamp: 1452-04-15 00:00:00 ». Тот же код работает, если я заменяю строки дат на некоторые недавние даты, такие как 2017-01-01.

df=pd.DataFrame({'Date':np.arange('1452-04-15', '1519-05-02', dtype='datetime64[D]')})

Этот пример кода предназначен для предоставления простого способа воспроизвести ошибку. Что я действительно пытаюсь сделать, так это прочитать csv, содержащий очень ранние даты, подобные этим, в массив данных и преобразовать строковые даты в np.datetime64 [D] или любой сопоставимый формат даты.

1 Ответ

0 голосов
/ 10 мая 2018

Вам нужно period_range:

r = pd.period_range('1452-04-15', '1519-05-02')
print (r)
PeriodIndex(['1452-04-15', '1452-04-16', '1452-04-17', '1452-04-18',
             '1452-04-19', '1452-04-20', '1452-04-21', '1452-04-22',
             '1452-04-23', '1452-04-24',
             ...
             '1519-04-23', '1519-04-24', '1519-04-25', '1519-04-26',
             '1519-04-27', '1519-04-28', '1519-04-29', '1519-04-30',
             '1519-05-01', '1519-05-02'],
            dtype='period[D]', length=24488, freq='D')

df = pd.DataFrame({'Date' : r})
print (df.head())
        Date
0 1452-04-15
1 1452-04-16
2 1452-04-17
3 1452-04-18
4 1452-04-19

потому что ограничения отметки времени :

In [66]: pd.Timestamp.min
Out[66]: Timestamp('1677-09-21 00:12:43.145225')

In [67]: pd.Timestamp.max
Out[67]: Timestamp('2262-04-11 23:47:16.854775807')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...