У меня есть фреймворк в R с данными временных рядов, и я пытаюсь построить график, сколько лайков получил человек в сообщении Instagram в заданную дату. Однако в некоторые даты пользователь может публиковать более одного сообщения, то есть у них будет несколько точек данных о количестве лайков на эту дату. Я не уверен, как я могу усреднить количество лайков, так что у меня останется только одна точка данных.
user <- c('John Doe')
likecount <- c(21000, 23400, 26800)
postdate <- as.Date(c('2010-11-1','2010-11-1','2010-11-2'))
df <- data.frame(user, likecount, postdate)
Итак, для этого примера кода мне нужно было бы иметь среднее значение лайков что оба приходятся на один день. Я бы предпочел прогнать весь фрейм данных и посмотреть, есть ли несколько экземпляров публикации в тот же день для одного пользователя, где я могу автоматически вычислить среднее количество лайков в эти даты.