используя слияние в R, чтобы заполнить NA в data.frame - PullRequest
1 голос
/ 07 марта 2011

У меня есть фрейм данных a, в котором отсутствует информация нескольких ячеек, я собрал недостающие данные и впоследствии создал еще один фрейм данных b.

Обычно я заполняю недостающие данные следующимcode:

for (loop.b in (1:nrow(b)))
    {a[a[,"uid"]==b[loop.b,"uid"],"var1"] <- b[loop.b,"var1"]
    }

У меня все в порядке, но что если в b много строк?Тогда явный цикл замедлит процесс.Есть ли какой-нибудь более изящный способ выполнить такую ​​работу по "замене отсутствующих данных"?

Спасибо.

Ответы [ 3 ]

1 голос
/ 07 марта 2011

Предполагая, что два следующих фрейма данных похожи на то, что вы описываете:

R> a <- data.frame(uid=1:10,var1=c(1:3,NA,5:7,NA,9:10))
R> a
   uid var1
1    1    1
2    2    2
3    3    3
4    4   NA
5    5    5
6    6    6
7    7    7
8    8   NA
9    9    9
10  10   10

R> b <- data.frame(uid=c(8,4),var1=c(74,82))
R> b
  uid var1
1   8   74
2   4   82

Тогда вы можете напрямую использовать следующее:

R> a[b$uid,"var1"] <- b$var1

Что дает:

R> a
   uid var1
1    1    1
2    2    2
3    3    3
4    4   82
5    5    5
6    6    6
7    7    7
8    8   74
9    9    9
10  10   10
1 голос
/ 28 июня 2013

Это работает:

# matches of a$uid in b$uid, NA if not match
ind = match(a$uid, b$uid) 
# 'ind' are the index in b and NA, we remove the latter
a[!is.na(ind),"var1"] = b[ind[!is.na(ind)],"var1"] 
0 голосов
/ 07 марта 2011

Я думаю, что вы хотите match, но трудно предположить, на что похожи ваши данные.

## a's var1 has some missing values
a <- data.frame(var1 = c(1, NA, 4.5, NA, 6.5), uid = 5:1)
## b knows all about them
b <- data.frame(var1 = c(2.3, 8.9), uid = c(2, 4))

## find the indexes in a$uid that match b$uid
ind <- match(b$uid, a$uid)

## those indexes now can be filled directly with b$uid
a$var1[ind] <- b$var1

Это будет работать, даже если идентификаторы не уникальны (хотя название предполагает, что они есть).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...