Сбой pd.cut в сборке int64 intervalindex from_arrays - PullRequest
0 голосов
/ 27 ноября 2018

Версия для панд: 0.20.1

У меня есть несколько интервалов

>print(periods)
IntervalIndex([(1459486800000000000, 1459490400000000000], (1459503000000000000, 1459506600000000000], (1459521000000000000, 1459524600000000000], (1459540800000000000, 1459544400000000000], (1459573200000000000, 1459576800000000000] ... (1475164800000000000, 1475168400000000000], (1475215860000000000, 1475219460000000000], (1475219460000000000, 1475223060000000000], (1475229660000000000, 1475233260000000000], (1475240400000000000, 1475244000000000000]]
              closed='right',
              dtype='interval[int64]')

У меня также есть df со стартом

print(df.head(3)['Start'].astype(np.int64))

1    1463725423954004000
2    1463725440994005000
5    1463732892934001000

Я бы хотелиспользовать pd.cut в эти периоды.Я пытался

 df['val'] = pd.cut(df['Start'].astype(np.int64), bins=periods)

But it get the following
    //python2.7/site-packages/pandas/core/indexes/interval.pyc in get_loc(self, key, method)
    705                 return self._engine.get_loc_interval(left, right)
    706             else:
--> 707                 return self._engine.get_loc(key)
    708 
    709     def get_value(self, series, key):

pandas/_libs/intervaltree.pxi in pandas._libs.interval.IntervalTree.get_loc (pandas/_libs/interval.c:9756)()

KeyError: 1463725423954004000

Я не могу понять, почему я получаю это, после прочтения документации

...