У меня есть фрейм данных с интервалами и меткой, связанной с каждым. Мне нужно сгруппировать и объединить строки, отстоящие друг от друга на определенное расстояние.
Например, строки групп, чьи начало / конец находятся в пределах 3 единиц от начала / конца других строк, объединяют свои поля label
:
In [16]: df = pd.DataFrame([
...: [ 1, 3,'a'], [ 4,10,'b'],
...: [15,17,'c'], [18,20,'d'],
...: [27,30,'e'], [31,40,'f'], [41,42,'g'],
...: [50,54,'h']],
...: columns=['start', 'end', 'label'])
...:
In [17]: df
Out[17]:
start end label
0 1 3 a
1 4 10 b
2 15 17 c
3 18 20 d
4 27 30 e
5 31 40 f
6 41 42 g
7 50 54 h
Желаемый вывод:
In [18]: df_desired = group_by_interval(df)
In [19]: df_desired
Out[19]:
start end label
0 1 10 a b
1 15 20 c d
2 27 30 e f g
3 50 54 h
Как я могу выполнить такую группировку по интервалу с фреймом данных?
Я нашел один аналог SO здесь , но он немного отличается, поскольку я не знаю, где вырезать априори .