R: Группировка по последовательности строк - PullRequest
0 голосов
/ 21 мая 2019

У меня есть кадр данных из IMDB, который выглядит следующим образом.Это, к сожалению, не сгруппировано, но я надеялся, что смогу сделать это сгруппировать R.

Данные выглядят так:

V1                  V2              starts_with
NM: Aarons          Alex            NM
DB: 15 May 1890     Philadelphia    DB
NM: Aarons          Leroy           NM
NM: Aarons          Shawn           NM
DB: 26 March 1989   Jamaica         DB

Я хотел бы добавить новый столбец.последовательность, основанная на комбинации NM и DB.Каждый раз, когда появляется новый «NM», будет появляться новый номер:

V1                  V2              starts_with     group
NM: Aarons          Alex            NM              1
DB: 15 May 1890     Philadelphia    DB              1
NM: Aarons          Leroy           NM              2
NM: Aarons          Shawn           NM              3
DB: 26 March 1989   Jamaica         DB              3

Я, конечно, искал SO и видел эту последовательность генерации в группе в R , но этот пример уже былгруппироваться.Мои данные, к сожалению, не сгруппированы.

1 Ответ

1 голос
/ 21 мая 2019

Вы можете использовать cumsum:

df$group = cumsum(df$starts_with == "NM")
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...