Я хочу удалить определенные последовательности из моего столбца, потому что они появляются много и не дают мне много дополнительной информации.База данных состоит из ребер между узлами.В этом случае будет грань между узлом 1 и узлом 1, узлом 1 и узлом 2, узлом 2 и узлом 3 .....
Однако, ребро 1-5 происходит около 80.000 раз внастоящая база данных.Я хочу отфильтровать их, сохраняя только «не очень распространенные» взаимодействия.
Допустим, мой фрейм данных выглядит следующим образом
>>> datatry
num line
0 1 56
1 1 90
2 2 66
3 3 4
4 1 23
5 5 22
6 3 144
7 5 33
У меня до сих пор было удаление последовательности, которая только повторялась:
c1 = datatry['num'].eq('1')
c2 = datatry['num'].eq(datatry['num'].shift(1))
datatry2 = datatry[(c1 & ~c2) | ~(c1)]
Как я мог изменитькод выше (который удаляет все строки, которые повторяют целое число 1 и сохраняет только первую строку со значением 1), чтобы код, который удаляет все строки, которые являются определенной последовательностью?Например: 1, а затем 5?В этом случае я хочу удалить строку со значением 1 и строку со значением 5, которые появляются в этой последовательности.Мой конечный результат в идеале был бы:
>>> datatry
num line
0 1 56
1 1 90
2 2 66
3 3 4
4 3 144
5 5 33