Анализ временных рядов в R (определение тенденций) - PullRequest
0 голосов
/ 06 мая 2020

У меня есть набор данных твитов с 2013 по 2017 год. Я закодировал определенные функции сообщения (0 - отсутствие и 1 - присутствие) и пытался выяснить, есть ли тенденция (т.е. появление сообщения функция постепенно увеличивается / уменьшается) в моем наборе данных. Как мне это сделать в R?

1 Ответ

0 голосов
/ 06 мая 2020

Вы можете попробовать линейную модель, например, один из ответов, приведенных в здесь .

#for reproducing
set.seed(200)
library(ggplot2)
#simple example. Assume your data is simple binomial variable with probability 0.3
data <- data.frame(time = 1:200, val=sample(c(0,1), size = 200, replace = T, prob = c(0.3, 0.7)))

#plot using ggplot and add linear regression and confidence interval
ggplot(data, aes(x = time, y=val)) + geom_smooth(method=lm) +geom_point()

#Now we can try to create linear regression
y = data$time
    x = data$val
fitData <- lm(x ~ y)
predict(fitData, newdata = data.frame(y=201:224), interval="confidence")

#You can also take advantage of geom_smooth that find the best model if your don't specify any:
ggplot(data, aes(x = time, y=val)) + geom_smooth() +geom_point()

#Here, it seems that loess would be better

Некоторый код для выполнения лессовой регрессии в R здесь .

Удачи!

...