Cut by day пропускает дни в начале и в конце года - PullRequest
0 голосов
/ 26 октября 2018

Я пытаюсь получить общее количество наблюдений, связанных с определенным цветом.

Date <- c("2017-01-01","2017-01-01","2017-01-02","2017-01-03","2017-01-03","2017-01-03","2017-01-03","2017-01-04","2017-01-04","2017-01-05")

Factor<-c("red", "blue", "green", "red", "red", "green", "green", "blue", "blue", "green")

Отдельная таблица для каждого из факторов. Все они должны иметь одну строку для каждого дня года и общего количества наблюдений.

green <-  table(cut(ex$Date[which(ex$Factor=="green")], 'day'))

Это как-то работает, но не идеально. Если на 01.01.2017 года нет наблюдений, а на 02.01.2017 года - один, то он запустит Список с 02.01.2017. Набор данных за один год. Та же проблема возникает в конце года (например, 31.12.2017, 30.12.2017, ... опущено).

2017-01-02   1
2017-01-03   2
2017-01-04   0
2017-01-05   1

У кого-нибудь есть идеи, как мне это решить?

1 Ответ

0 голосов
/ 26 октября 2018

Вот одна базовая опция R с использованием aggregate:

df <- data.frame(Date, Color, stringsAsFactors=FALSE)
aggregate(df$Color, by=list(Date=df$Date), FUN=function(x) { sum(x=="green") })

        Date x
1 2017-01-01 0
2 2017-01-02 1
3 2017-01-03 2
4 2017-01-04 0
5 2017-01-05 1

Данные:

Date <- c("2017-01-01","2017-01-01","2017-01-02","2017-01-03","2017-01-03","2017-01-03",
    "2017-01-03","2017-01-04","2017-01-04","2017-01-05")
Color <- c("red", "blue", "green", "red", "red", "green", "green", "blue", "blue", "green")
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...