Размер группы не соответствует столбцу - PullRequest
0 голосов
/ 07 апреля 2020

У меня есть набор данных, который выглядит следующим образом:

Observations: 49,358
Variables: 22
$ congress                      <int> 1, 1, 1, 1, 1, 1...
$ icpsr                         <int> 99869, 4766, 845...

Переменная congress идет от 1 до 116. Я пытаюсь создать переменную, которая идентифицирует это начало конгресса (1789) и продолжается до конец (2019) с 2-летними интервалами. Эта переменная будет иметь длину 116, равную размеру группы конгресса. Тем не менее, когда я запускаю следующий код:

data %>%
group_by(congress) %>%
mutate(start = seq(1789,2019,2)) 

я получаю эту ошибку:

Error: Column `start` must be length 96 (the group size) or one, not 116

Буду признателен за любую помощь. Спасибо!

1 Ответ

0 голосов
/ 07 апреля 2020

В следующей версии dplyr (1.0.0) предпринятый код будет работать так же, как с summarise, но в то же время вы можете получить данные в списке и unnest:

library(dplyr)

data %>%
  group_by(congress) %>%
  summarise(start = list(seq(1789,2019,2))) %>%
  tidyr::unnest(start)
...