R: использование «где» для выбора строк путем сопоставления элемента из списка - PullRequest
1 голос
/ 28 марта 2012

Я пытаюсь использовать функцию «где» в R внутри цикла, чтобы выбрать определенную строку из двух наборов данных, основанных на совпадающем элементе, а затем составить диаграмму рассеяния из двух. В приведенном ниже примере кода приведены имена строк двух информационных кадров и цикла. Каждый фрейм данных содержит больше округов, чем указано в «mycounties».

Я использовал функцию "где" в цикле точно так же, как это раньше, но на этот раз R возвращает сообщение об ошибке, что "где" не существует? Я знаю, "где" существует! Мой вопрос: как заставить R распознавать эту структуру «где», или есть лучший способ выделить строки, которые я хочу построить? Спасибо!

 > names(dts)
 [1] "county"  "Freq125" "Freq126" "Freq127" "Freq128" "Freq129" "Freq130" "Freq131" "Freq132" "Freq133" "Freq134" "Freq135" "Freq136" "Freq137"
[15] "Freq138" "Freq139" "Freq140" "Freq141" "Freq142" "Freq143" "Freq144" "Freq145" "Freq146" "Freq147" "Freq148" "Freq149" "Freq150" "Freq151"
[29] "Freq152" "Freq153" "Freq154" "Freq155" "Freq156" "Freq157" "Freq158" "Freq159" "Freq160" "Freq161" "Freq162" "Freq163" "Freq164" "Freq165"
[43] "Freq166" "Freq167" "Freq168" "Freq169" "Freq170" "Freq171"

> names(pm)
 [1] "county" "pm125m" "pm126m" "pm127m" "pm128m" "pm129m" "pm130m" "pm131m" "pm132m" "pm133m" "pm134m" "pm135m" "pm136m" "pm137m" "pm138m"
[16] "pm139m" "pm140m" "pm141m" "pm142m" "pm143m" "pm144m" "pm145m" "pm146m" "pm147m" "pm148m" "pm149m" "pm150m" "pm151m" "pm152m" "pm153m"
[31] "pm154m" "pm155m" "pm156m" "pm157m" "pm158m" "pm159m" "pm160m" "pm161m" "pm162m" "pm163m" "pm164m" "pm165m" "pm166m" "pm167m" "pm168m"
[46] "pm169m" "pm170m" "pm171m"
> 
> mycounties = c("beaufort", "bertie", "bladen", "camden", "carteret", "chowan", "craven", 
+   "cumberland", "currituck", "dare", "duplin", "gates", "greene", "harnett", "hyde",
+   "jones", "lenoir", "new hanover", "onslow", "pamlico", "pasquotank", "pender", "perquimans", "pitt", "robeson", "sampson", "tyrrell", "washington")
> 
> LOOP
> for (i in 1:length(mycounties)) {
+ x = pm[where(pm$county == mycounties[i]),2:48]
+ y = dt[where(dts$county == mycounties[i]),2:48 ]
+ plot( x, y, main=paste("HYSPLIT & ED Visits", counties[i], sep=""),
+  xlab="HYSPLIT", ylab="ED Visits", pch=19)
+ } 
Error in `[.data.frame`(pm, where(pm$county == mycounties[i]), 2:48) : 
  could not find function "where"

Ответы [ 2 ]

5 голосов
/ 28 марта 2012

Как сказал Джефф и в комментариях, нет функции где. which - версия R.

Однако в этом примере вам вообще не нужен which:

x <- pm[pm$county == mycounties[i], 2:48]
y <- dt[dt$county == mycounties[i], 2:48]

Также в вашем примере if выражение:

if (mat$county[i] %in% dt5$county)) {
    mat[i,2:58] = dt5[dt5$county == mat$county[i], 2:58]
}

Предполагается, что у вашего dt5$county есть только один соответствующий округ для каждого mat$county[i] В противном случае вы получите ошибку.

3 голосов
/ 28 марта 2012

Вы пытаетесь обратиться к функции which()?

...