Вставьте строки в датафрейме с датой, категорией и количеством - PullRequest
0 голосов
/ 12 декабря 2018

У меня есть кадр данных в R с 3 столбцами: категория (94 уникальных категории), столбец даты и столбец целого числа.Пример необработанных данных:

id      date        count
4668    2017-01-01  1
4771    2017-01-01  8
4883    2017-01-01  2
4884    2017-01-01  6

Я хочу иметь строку для каждого идентификатора на каждый день с 2017-01-01 по 2018-12-10 (708 * 94 = 66,552 строки), прямо сейчасМне не хватает строк для разных клиентов.Я попытался использовать следующий код, чтобы заполнить пропущенные строки для каждого идентификатора (количество должно быть 0 для пропущенных строк):

> data_filled <- data%>%
+     mutate(Date = as.Date(date)) %>%
+     complete(Date = seq.Date(min(date), max(date), by="day"),id)

Это заполнило несколько строк (с NA), но не все.Я также попытался:

>data_filled <- data%>%
   +  complete(nesting(id, count), date = seq(min(date), max(date), by = "day"))

Это дало мне 1298888 строк.

Я также пытался сгруппировать / разгруппировать фрейм данных, но это тоже не сработало.Я немного растерялся из-за того, что я делаю неправильно.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...