Я пытаюсь выяснить, какой пакет больше всего подходит для отсутствующих данных. И пакеты wql, и EnvStats выполняют тест Ван Белля и Хьюза, но результаты отличаются, когда вводятся недостающие данные. При отсутствии отсутствующих данных результаты идентичны.
library(wql)<br/>
library(EnvStats)<br/>
library(zoo)<br/>
library(tidyverse)<br/>
library(lubridate)<br/>
test <- ts(rnorm(120),frequency = 12,start = c(1990,1))#generate a time series
ind <- which(test %in% sample(test,15))# generate 15 random samples
test[ind] <- NA # replace samples with NA
test_df <-
data.frame(y=as.matrix(test),date=as.Date(as.yearmon(time(test))))#convert ts to df
test_df <- test_df %>% mutate(date=ymd(date),month=month(date), year=year(date))
trendHomog(test) # run test
# $chi2.trend
[1] 0.3038136
# $chi2.homog
[1] 1.631839
# $p.value
[1] 0.6521924
# $n
[1] 4
kendallSeasonalTrendTest(y~month+year,data = test_df)# run test
Seasonal Kendall Test for Trend (with continuity correction)
Chi-Square (Het) = 2.74120, z (Trend) = 0.24638, df = 11, p-value
= 0.9937, p-value = 0.8054
alternative hypothesis: The seasonal taus are not all equal
(Chi-Square Heterogeneity Test)
At least one seasonal tau != 0
and all non-zero tau's have the
same sign (z Trend Test)
null values:
tau tau tau tau tau tau tau tau tau tau tau tau
0 0 0 0 0 0 0 0 0 0 0 0
sample estimates:
tau slope intercept
0.02312925 0.01459336 -61.60301045
Я вижу, что при использовании пакета wql в этом примере использовались только 4 сезона. Это означает, что существует некоторое фоновое правило, исключающее сезоны из анализа.
Любая помощь приветствуется