Я хотел бы выполнить статистическую значимость на основе моделирования Монте-Карло в R, но я не знаю, как правильно сформулировать это.
У меня есть следующий набор данных:
[ Ссылка на данные] (https://www.dropbox.com/s/29zgm8nm39qyh7m/data_rainfall.csv?dl=0)
Есть четыре столбца (год, месяц, день, фаза и количество осадков).
[Проблема]
Я хочу знать вероятность возникновения (значимости) получения
(а) осадков ниже 5 мм / сут в течение не менее 3 дней подряд И также с фазой, равной 1.
[Вот что у меня есть]
dat<-read.csv("data_rainfall.csv",header=T)
dat2<-as.data.frame(cbind(dat$phase,dat$Rainfall))
dat2<-na.omit(dat2)
Функция значимости:
sig.test <- function (){
s1 <- dat2[sample(1:nrow(dat2),5,replace=T),]
sum(sum(rle(s1$V1 < 5 & s1$V2 ==1)$lengths)>=3)>1
}
runs <- 1000
sig <- sum(replicate(runs,sig.test()))/runs
К сожалению, это приводит к 1, что немного странно! Я также не знаю, как правильно реализовать «последовательные» дни осадков ниже 5 мм / день.
Как я могу сделать это правильно в R?
Буду признателен за любую помощь в этом.
- Линдз