У меня проблема в том, что мои данные (файл CSV) являются повторяющимися значениями.Но последовательные значения важны друг для друга, а не для другого.Мне нужно сгруппировать строки по одинаковым значениям в столбце, но для значений, которые находятся только рядом друг с другом.
IE для (2,1) = [[0.5, 1.5], [1.2, 2.3], (2,2) = [[1,3, 0,5], [2,5, 1,5]] и т. Д.
col a posX pos y
0 1 0.5 1.5
1 1 1.2 2.3
2 2 1.3 0.5
3 2 2.5 1.5
4 3 0.7 0.7
5 3 1.6 4.0
6 3 2.1 5.1
7 1 1.2 2.4
8 1 1.5 2.5
9 1 1.6 2.6
10 2 2.0 1.5
Поэтому (2,1)! = (3,1) они содержат возможно различную длину или другое значение
мои данные большие, 25000 строк, поэтому я не могу быть уверен, что (2,1) не будет происходить более одного раза, поэтому я не могу использовать длину в качестве ключа уникального значения
Я изо всех сил пытаюсь объединить эти данные без объединения всех этих значений, потому что при использовании
df.groupby['col a']
он объединяет все 1.
спасибо
отредактирован для уточнения ожидаемого результата и дал больше информации