Logi c за индексацией серии Pandas с PeriodIndex - PullRequest
0 голосов
/ 14 апреля 2020

Вот серия с PeriodIndex:

import pandas as pd
import numpy as np

tp = pd.Series(np.arange(5), index=pd.period_range('2020-7-1 12:15', periods=5, freq='60T'))

2020-07-01 12:15    0
2020-07-01 13:15    1
2020-07-01 14:15    2
2020-07-01 15:15    3
2020-07-01 16:15    4

Каково объяснение того, что tp['2020-7-1 12'] возвращает

2020-07-01 12:15    0
2020-07-01 13:15    1

?

Я бы ожидать, что это индексирование вернется (если оно вообще произойдет)

2020-07-01 12:15    0

, потому что 60 минут, начиная с 2020-07-01 12:00, просто пересекаются с первым периодом во временном интервале [2020-07 -01 12:15, 2020-07-01 13: 14.999 ...]

Я думал, что приведенное выше индексирование будет просто похоже на

idx = pd.Period('2020-7-1 12', freq='60T')
tp[idx:idx+1]

, что дает то, что я ожидал case: 2020-07-01 12:15 0, поскольку временной интервал [idx: idx + 1] = [2020-07-01 12:00:00, 2020-07-01 13: 59: 59.999999999] полностью содержит только первый период в серии.

...