ошибка без сообщения об ошибке при замене части имен столбцов другими именами в датафрейме - PullRequest
0 голосов
/ 30 ноября 2018

У меня есть кадр данных с именами столбцов, как показано в данных dput ниже.

structure(list(mosales = c(1L, 1L, 1L, 12L, 1L), sale123 = c(14.86, 
8.97, 6.44, 463.61, 15.94), totsales = c(1L, 1L, 1L, 
30L, 1L), totqty = c(1L, 1L, 1L, 34L, 2L), unqsales = c(1L, 
1L, 1L, 6L, 2L), x1_rank_1 = c(1L, 1L, 1L, 0L, 1L), x1_rank_4 = c(0L, 
0L, 0L, 1L, 0L), x1_rank_3 = c(0L, 0L, 0L, 0L, 0L), x1_rank_2 = c(0L, 
0L, 0L, 0L, 0L), x2_rank_2 = c(1L, 1L, 0L, 0L, 1L), x2_rank_1 = c(0L, 
0L, 1L, 0L, 0L), x2_rank_5 = c(0L, 0L, 0L, 1L, 0L), x2_rank_4 = c(0L, 
0L, 0L, 0L, 0L), x2_rank_3 = c(0L, 0L, 0L, 0L, 0L), x3_rank_1 = c(1L, 
1L, 1L, 0L, 1L), x3_rank_4 = c(0L, 0L, 0L, 1L, 0L), x3_rank_3 = c(0L, 
0L, 0L, 0L, 0L), x3_rank_2 = c(0L, 0L, 0L, 0L, 0L), x4_rank_1 = c(1L, 
1L, 1L, 0L, 0L), x4_rank_5 = c(0L, 0L, 0L, 1L, 0L), x4_rank_2 = c(0L, 
0L, 0L, 0L, 1L), x4_rank_4 = c(0L, 0L, 0L, 0L, 0L), x4_rank_3 = c(0L, 
0L, 0L, 0L, 0L), x5_rank_1 = c(1L, 1L, 1L, 0L, 0L), x5_rank_4 = c(0L, 
0L, 0L, 1L, 0L), x5_rank_2 = c(0L, 0L, 0L, 0L, 1L), x5_rank_3 = c(0L, 
0L, 0L, 0L, 0L)), row.names = c(36L, 41L, 72L, 79L, 137L), class = "data.frame")

Я пытаюсь заменить имена столбцов, которые начинаются с x1_rank, x2_rank .. and so forth, именами, такими, что " x1_rank " следует заменить на мозаики, " x2_rank " следует заменить на sales123 , " x3_rank " заменить на " totsales ", " x4_rank"следует заменить на" totqty", а" x5_rank"заменить на" unqsales".

Таким образом, конечные имена столбцов будут выглядеть так:

mosales, sale123, totsales, totqty, unqsales, mosales_1, mosales_2,... sale123_1, sale123_2,... totsales_1, totsales_2,... totqty_1, totqty_2,... unqsales_1, unqsales_2,...

Я попытался использовать цикл for и gsub, как показано ниже.Этот код работал без ошибок, но я не получил то, что искал.Не уверен, где находится ошибка.

df1 <- df
z <- names(df)

for (i in 1:length(z)){
  gsub(paste0("x",i,"_rank"), z[i], names(df1))
}

df - это кадр данных, который может быть создан с использованием указанных выше данных dput.

Ответы [ 2 ]

0 голосов
/ 30 ноября 2018

Функции манипуляции со строками в пакете stringi векторизованы по pattern, replacement и (необязательно) string.Это очень удобно для вашего случая:

library(stringi)

orig <- c(stri_c("x", 1:5, "_rank"))
repl <- c("mosales", "sales123", "totsales", "totqty", "unqsales")
names(df) <- stri_replace_all_fixed(names(df), orig, repl,
                                    vectorize_all = FALSE)
0 голосов
/ 30 ноября 2018

Вы можете использовать этот регистр \\bx1_rank[a-zA-Z]*.

Это будет соответствовать x1_rank в начале строки.

gsub позволяет заменить найденный шаблон тем, что вы хотите.Повторите для всех необходимых случаев.

В цикле:

repl <- c("mosales", "sales123", "totsales", "totqty", "unqsales")

for (i in 1:5) {
  p = paste0("\\b^x", i, "_rank[a-zA-Z]*")
  colnames(d) = gsub(pattern=p, repl[i], colnames(d))
}
colnames(d)

# 
# [1] "mosales"    "sale123"    "totsales"   "totqty"     "unqsales"   "mosales_1"  "mosales_4" 
# [8] "mosales_3"  "mosales_2"  "sales123_2" "sales123_1" "sales123_5" "sales123_4" "sales123_3"
# [15] "totsales_1" "totsales_4" "totsales_3" "totsales_2" "totqty_1"   "totqty_5"   "totqty_2"  
# [22] "totqty_4"   "totqty_3"   "unqsales_1" "unqsales_4" "unqsales_2" "unqsales_3"
...