Версия для панд: 0.20.1
У меня есть несколько интервалов
>print(periods)
IntervalIndex([(1459486800000000000, 1459490400000000000], (1459503000000000000, 1459506600000000000], (1459521000000000000, 1459524600000000000], (1459540800000000000, 1459544400000000000], (1459573200000000000, 1459576800000000000] ... (1475164800000000000, 1475168400000000000], (1475215860000000000, 1475219460000000000], (1475219460000000000, 1475223060000000000], (1475229660000000000, 1475233260000000000], (1475240400000000000, 1475244000000000000]]
closed='right',
dtype='interval[int64]')
У меня также есть df
со стартом
print(df.head(3)['Start'].astype(np.int64))
1 1463725423954004000
2 1463725440994005000
5 1463732892934001000
Я бы хотелиспользовать pd.cut
в эти периоды.Я пытался
df['val'] = pd.cut(df['Start'].astype(np.int64), bins=periods)
But it get the following
//python2.7/site-packages/pandas/core/indexes/interval.pyc in get_loc(self, key, method)
705 return self._engine.get_loc_interval(left, right)
706 else:
--> 707 return self._engine.get_loc(key)
708
709 def get_value(self, series, key):
pandas/_libs/intervaltree.pxi in pandas._libs.interval.IntervalTree.get_loc (pandas/_libs/interval.c:9756)()
KeyError: 1463725423954004000
Я не могу понять, почему я получаю это, после прочтения документации