уникальный идентификатор панд для последовательностей - PullRequest
0 голосов
/ 18 октября 2018

Я хочу сгенерировать уникальный идентификатор для каждой последовательности в кадре данных pandas, где начало последовательности помечено из другого столбца.

У меня есть столбцы X, Y и BOOL, и я хочу создать столбец NEW_ID

X  Y  BOOL  NEW_ID

x  y  TRUE    1
x  y  FALSE   1
x  y  FALSE   1
x  y  TRUE    2
x  y  FALSE   2
x  y  FALSE   2
x  y  FALSE   2
x  y  TRUE    3
x  y  TRUE    4
x  y  FALSE   4

Я пытаюсь найти решение без циклов for, поскольку у меня большой фрейм данных иэто занимает слишком много времени ..

1 Ответ

0 голосов
/ 18 октября 2018

Использование cumsum с колонкой BOOL

df['New_ID']=df.BOOL.cumsum()
df
Out[39]: 
   X  Y   BOOL  NEW_ID  New_ID
0  x  y   True       1       1
1  x  y  False       1       1
2  x  y  False       1       1
3  x  y   True       2       2
4  x  y  False       2       2
5  x  y  False       2       2
6  x  y  False       2       2
7  x  y   True       3       3
8  x  y   True       4       4
9  x  y  False       4       4
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...