Question

У меня есть кадр данных из IMDB, который выглядит следующим образом.Это, к сожалению, не сгруппировано, но я надеялся, что смогу сделать это сгруппировать R.

Данные выглядят так:

V1                  V2              starts_with
NM: Aarons          Alex            NM
DB: 15 May 1890     Philadelphia    DB
NM: Aarons          Leroy           NM
NM: Aarons          Shawn           NM
DB: 26 March 1989   Jamaica         DB

Я хотел бы добавить новый столбец.последовательность, основанная на комбинации NM и DB.Каждый раз, когда появляется новый «NM», будет появляться новый номер:

V1                  V2              starts_with     group
NM: Aarons          Alex            NM              1
DB: 15 May 1890     Philadelphia    DB              1
NM: Aarons          Leroy           NM              2
NM: Aarons          Shawn           NM              3
DB: 26 March 1989   Jamaica         DB              3

Я, конечно, искал SO и видел эту последовательность генерации в группе в R , но этот пример уже былгруппироваться.Мои данные, к сожалению, не сгруппированы.

akash87 · Answer 1 · 21 мая 2019

Вы можете использовать cumsum:

df$group = cumsum(df$starts_with == "NM")

R: Группировка по последовательности строк

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

R: Группировка по последовательности строк

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов