Матрица корреляции между различными объектами зоопарка - PullRequest
0 голосов
/ 18 июня 2011

У меня есть несколько файлов с объектами зоопарка, которые выглядят так (каждый файл начинается и заканчивается в разные даты):

           code pp  
1942-06-01 4016  0  
1942-06-02 4016  NA  
1942-06-03 4016  0  
1942-06-04 4016  0  
1942-06-05 NA    0  
1942-06-06 NA    0

Я хочу сделать матрицу корреляции между pp всех файлов длямесяцы сентябрь, октябрь и ноябрь (с указанием кодов, чтобы я мог определить, кто есть кто).Я не могу использовать функцию list.files (код любезно предоставлен Джораном в Матрица корреляции между различными файлами ) из-за NA в столбце кода.Итак, я придумал следующий код:

files <- list.files(pattern=".csv")
xx<-read.zoo(files[1],sep=",", header=TRUE,index.column=1)  
name<- as.name(xx$code[[1]])  
colnames(xx) <- c("code", name)  
x<-xx[months(time(xx), TRUE) %in% c("Sep", "Oct", "Nov")]  
yy<-read.zoo(files[2],sep=",", header=TRUE,index.column=1)  
name<- as.name(yy$code[1])  
colnames(yy) <- c("code", name)  
y<-yy[months(time(yy), TRUE) %in% c("Sep", "Oct", "Nov")]  
CET<-merge(x, y, all = TRUE, fill = NA, check.names=FALSE)  
for (i in 3:length(files))  
{
  z<-read.zoo(files[i],sep=",", header=TRUE,index.column=1)  
  name<- as.name(z$code[1])  
  colnames(z) <- c("code", name)  
  CET<-merge(CET, z, all = TRUE, fill = NA, check.names=FALSE)  
}  
a<-1:(dim(CET)[2])  
even <- a[ a%%2 == 0 ]    
# saves the precipitation column (even numbers) and discards the code ones
dat<-CET[,even]
c.mat<-cor(dat,use="pairwise.complete.obs" )

Но что-то не так: в матрице корреляции некоторые имена столбцов / строк имеют дополнительные ".z" или ".CET" и, что самое важное,коэффициенты корреляции не верны!Я не могу найти проблему, поэтому любая помощь в поиске проблемы или предложении более простого кода для этого будет очень признательна!

1 Ответ

0 голосов
/ 24 июня 2011

Я не знаю почему, но если вместо извлечения месяца, который я хочу из каждого файла, а затем слить их в 1 файл, я объединяю файлы и только затем извлекаю месяцы, которые я хочу, чтобы значения корреляций были правильными ! Я имею в виду:

files <- list.files(pattern=".csv") x<-read.zoo(files[1],sep=",", header=TRUE,index.column=1)<br> y<-read.zoo(files[2],sep=",", header=TRUE,index.column=1)<br> CET<-merge(x, y, all = TRUE, fill = NA, check.names=FALSE)<br> for (i in 3:length(files))<br> {<br> z<-read.zoo(files[i],sep=",", header=TRUE,index.column=1)<br> CET<-merge(CET, z, all = TRUE, fill = NA, check.names=FALSE)<br> }<br> a<-1:(dim(CET)[2])<br> even <- a[ a%%2 == 0 ]<br> dat<-CET[,even]<br> dat.aut<-dat[months(time(dat), TRUE) %in% c("Sep", "Oct", "Nov")]<br> c.mat<-cor(dat.aut,use="pairwise.complete.obs" )

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...