У меня фрейм данных для панд выглядит так:
df = pd.DataFrame(data = {
'v1': ['a', 'a', 'c', 'b', 'd', 'c', 'd', 'c', 'f', 'e'],
'v2': ['b', 'b', 'd', 'a', 'c', 'e', 'c', 'd', 'g', 'c'],
'v3': range(0,10)})
v1 v2 v3
0 a b 0
1 a b 1
2 c d 2
3 a b 3
4 c d 4
5 c e 5
6 c d 6
7 c d 7
8 f g 8
9 c e 9
Я хочу получить результат, похожий на:
v1 v2 count
0 a b 2
1 c d 3
2 c e 2
3 f g 1
Первая строка "a b 2"
, исходит от "a b"
"a b"
1010 *.поскольку "a b"
отображается непрерывно дважды, считается только один раз.
Второй ряд "c d 3"
происходит от "c d"
, "d c"
, "d c"
, "c d"
, как "d c"
появляется непрерывно дважды
Третий ряд "c e 2"
происходит от "c e"
, "e c"
Последний ряд "f g 1"
происходит от "f g"
MyПервоначально предполагалось использовать groupby
, но я не знаю, как пропустить непрерывный вид.