Несколько точек данных в R на одну дату, которые необходимо усреднить для одной точки данных - PullRequest
0 голосов
/ 08 мая 2020

У меня есть фреймворк в R с данными временных рядов, и я пытаюсь построить график, сколько лайков получил человек в сообщении Instagram в заданную дату. Однако в некоторые даты пользователь может публиковать более одного сообщения, то есть у них будет несколько точек данных о количестве лайков на эту дату. Я не уверен, как я могу усреднить количество лайков, так что у меня останется только одна точка данных.


    user <- c('John Doe')
    likecount <- c(21000, 23400, 26800)
    postdate <- as.Date(c('2010-11-1','2010-11-1','2010-11-2'))

    df <- data.frame(user, likecount, postdate)

Итак, для этого примера кода мне нужно было бы иметь среднее значение лайков что оба приходятся на один день. Я бы предпочел прогнать весь фрейм данных и посмотреть, есть ли несколько экземпляров публикации в тот же день для одного пользователя, где я могу автоматически вычислить среднее количество лайков в эти даты.

1 Ответ

0 голосов
/ 08 мая 2020

Мы можем использовать aggregate

aggregate(likecount ~ ., df, mean)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...