У меня есть датафрейм в формате
df = pandas.DataFrame([{'tstamp':'2019-03-06 06:42:13.582500', 'value' : 1},
{'tstamp':'2019-03-06 06:43:28.937400', 'value': 2},
{'tstamp':'2019-03-06 06:43:28.937400', 'value' : -1},
{'tstamp':'2019-03-06 06:43:28.937400', 'value' : 2},
{'tstamp':'2019-03-06 06:43:28.937400', 'value' : -4},
{'tstamp':'2019-03-06 06:43:37.237500', 'value' : 1},
{'tstamp':'2019-03-06 06:43:37.237500', 'value' : 1},
{'tstamp':'2019-03-06 06:43:37.237500', 'value' : 1},
{'tstamp':'2019-03-06 06:47:25.470300', 'value' : 3},
{'tstamp':'2019-03-06 06:47:54.791500', 'value' : 4},
{'tstamp':'2019-03-06 06:49:11.971600', 'value' : 5},
{'tstamp':'2019-03-06 06:49:11.971600', 'value' : 2},
{'tstamp':'2019-03-06 06:49:33.285500', 'value' : 1},
{'tstamp':'2019-03-06 06:49:42.414700', 'value' : 10},
{'tstamp':'2019-03-06 06:49:55.300300', 'value' : 11},
{'tstamp':'2019-03-06 06:49:55.300300', 'value' : 9},
{'tstamp':'2019-03-06 06:52:03.992600', 'value' : -1},
{'tstamp':'2019-03-06 06:52:03.992600', 'value' : 2}])
Некоторые метки времени имеют связи.
У меня такой вопрос: как эффективно добавить только ту временную дельту к индексу строк с привязкой, чтобы разорвать связи в индексе, сохранив порядок данных?
@ jezrael:
Мне нужно создать новый столбец 'tstamp', назовем его 'tstamp2', который удовлетворяет следующим условиям:
(df.sort_values('tstamp2').index == df.sort_values('tstamp').index).all()
Верно,
df.tstamp2.duplicated().any()
Ложь,
(df[~df.tstamp.duplicated()].tstamp == df[~df.tstamp.duplicated()].tstamp2).all()
Верно,