R использует purrr :: map для применения функции к выбранным столбцам в списке данных - PullRequest
0 голосов
/ 27 февраля 2019

У меня есть список фреймов данных, где некоторые столбцы нуждаются в указании их правильной кодировки.Итак, я создал функцию для установки правильной кодировки, и я хотел бы применить эту новую функцию к определенным столбцам в моем списке данных.Как я могу сделать это с purrr:map?Я очень новичок в этом.


Пустой пример

# Set slovak characters
Sys.setlocale(category = "LC_ALL", locale = "Slovak")


# Make a function    
setEncoding<- function(x, ...) {
    Encoding(x)<-"UTF-8"  # set correct encoding on the vector
    x                     # print the output
}

# Create dummy data with wrong encoding
df1<-data.frame(name = "Ľubietovský Vepor",
                psb = "S CHKO PoÄľana",
                numb = 1)

df2<-data.frame(name = "Goliašová",
                psb = "S TANAP",
                numb = 2)

list1<-list(df1, df2)

My function seems working if applied on vector string:

>setEncoding(c("Ľubietovský Vepor", "Goliašová" ))
[1] "Ľubietovský Vepor" "Goliašová"  

# How to apply the whatever function (here setEncoding) on the selected columns from a dataframe list?? 

list1 %>%
  map(setEncoding[c("name", "psb")]) # How to fix this?

Что я хочу получить (правильное кодирование столбцов name, psb):

> ls
[[1]]
         name            psb numb
1 Ľubietovský Vepor S CHKO Poľana    1

[[2]]
         name     psb numb
1 Goliášová S TANAP    2

1 Ответ

0 голосов
/ 27 февраля 2019

Я не знаю деталей с кодировкой для вашего желаемого результата, но я могу ответить на вопрос относительно использования purrr.Вы можете использовать map_if, чтобы применить функцию только к character векторам (поскольку Encoding() ожидает ввода character).Также ваши примерные фреймы данных содержат факторы, а не строки.

library(purrr)
df1<-data.frame(name = "Ľubietovský Vepor",
                psb = "S CHKO PoÄľana",
                numb = 1, stringsAsFactors = FALSE)

df2<-data.frame(name = "Goliašová",
                psb = "S TANAP",
                numb = 2, stringsAsFactors = FALSE)

list1 <- list(df1, df2) #using ls conflicts with ls() function

list1 %>% 
  map_if(is.character, setEncoding) #this only maps on 'name' and 'pbs'
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...