Заменить символы с помощью gsub, как создать функцию? - PullRequest
17 голосов
/ 05 августа 2011

Я пытаюсь заменить символы в data.frame. У меня есть решение для этого

> df <- data.frame(var1 = c("aabbcdefg", "aabbcdefg"))
> df
       var1
1 aabbcdefg
2 aabbcdefg
> df$var1 <- gsub("a", "h", df$var1)
> df$var1 <- gsub("b", "i", df$var1)
> df$var1 <- gsub("c", "j", df$var1)
> df$var1 <- gsub("d", "k", df$var1)
> df$var1 <- gsub("e", "l", df$var1)
> df$var1 <- gsub("f", "m", df$var1)
> df
       var1
1 hhiijklmg
2 hhiijklmg
> 

но я бы хотел избежать использования нескольких вызовов gsub, было бы гораздо приятнее создать функцию, которая сделает это сразу?

Есть идеи, как продолжить?

Ответы [ 3 ]

32 голосов
/ 05 августа 2011

Вы хотите chartr:

df$var1 <- chartr("abcdef", "hijklm", df$var1)
df
#        var1
# 1 hhiijklmg
# 2 hhiijklmg
20 голосов
/ 05 августа 2011

Вы можете создать from и to векторов:

from <- c('a','b','c','d','e','f')
to <- c('h','i','j','k','l','m')

и затем векторизовать функцию gsub:

gsub2 <- function(pattern, replacement, x, ...) {
for(i in 1:length(pattern))
x <- gsub(pattern[i], replacement[i], x, ...)
x
}

, которая дает:

> df <- data.frame(var1 = c("aabbcdefg", "aabbcdefg"))
> df$var1 <- gsub2(from, to, df$var1)
> df
       var1
1 hhiijklmg
2 hhiijklmg
10 голосов
/ 05 августа 2011

Если вы не хотите использовать chartr, потому что замены могут содержать более одного символа, тогда другой вариант - использовать gsubfn из пакета gsubfn (я знаю, что это не gsub, а расширение для gsub).Вот один пример:

> library(gsubfn)
> tmp <- list(a='apple',b='banana',c='cherry')
> gsubfn('.', tmp, 'a.b.c.d')
[1] "apple.banana.cherry.d"

Замена также может быть функцией, которая будет принимать совпадение и возвращать значение замены для этого совпадения.

...