Ошибка сценария R {: пропущено значение, в котором требуется ИСТИНА / ЛОЖЬ в кадре данных - PullRequest
0 голосов
/ 28 августа 2018

У меня есть фрейм данных, который выглядит следующим образом

Name  Surname  Country  Path
John   Snow      UK     /Home/drive/John 
BOB    Anderson         /Home/drive/BOB
Tim    David     UK     /Home/drive/Tim 
Wayne  Green     UK     /Home/drive/Wayne

Я написал скрипт, который сначала проверяет, если country =="UK", если true, изменяет путь с "/Home/drive/" на "/Server/files/", используя gsub в R.

Сценарий

Pattern<-"/Home/drive/"

Replacement<- "/Server/files/"



 for (i in 1:nrow(gs_catalog_Staging_123))
{

  if( gs_catalog_Staging_123$country[i] == "UK" && !is.na(gs_catalog_Staging_123$country[i]))   
  {
   gs_catalog_Staging_123$Path<- gsub(Pattern , Replacement , gs_catalog_Staging_123$Path,ignore.case=T)
  }

}

Вывод, который я получаю:

    Name  Surname  Country  Path
John   Snow      UK     /Server/files/John 
*BOB    Anderson        /Server/files/BOB*
Tim    David     UK     /Server/files/Tim 
Wayne  Green     UK     /Server/files/Wayne

Вывод, который я хочу

Name  Surname  Country  Path
    John   Snow      UK     /Server/files/John 
    BOB    Anderson         /Home/drive/BOB
    Tim    David     UK     /Server/files/Tim 
    Wayne  Green     UK     /Server/files/Wayne

Как мы можем ясно видеть, gsub не распознает пропущенные значения и также добавляет эту строку.

1 Ответ

0 голосов
/ 28 августа 2018

Многие функции R векторизованы, поэтому здесь можно избежать цикла.

# example data
df <- data.frame(
    name    = c("John", "Bob", "Tim", "Wayne"),
    surname = c("Snow", "Ander", "David", "Green"),
    country = c("UK", "", "UK", "UK"),
    path    = paste0("/Home/drive/", c("John", "Bob", "Tim", "Wayne")),
    stringsAsFactors = FALSE
)

# fix the path
df$newpath <- ifelse(df$country=="UK" & !is.na(df$country), 
                     gsub("/Home/drive/", "/Server/files/", df$path),
                     df$path)

# view result
df
   name surname country              path             newpath
1  John    Snow      UK  /Home/drive/John  /Server/files/John
2   Bob   Ander           /Home/drive/Bob     /Home/drive/Bob
3   Tim   David      UK   /Home/drive/Tim   /Server/files/Tim
4 Wayne   Green      UK /Home/drive/Wayne /Server/files/Wayne

На самом деле, это проблема с вашим кодом. Каждый раз в цикле вы проверяете строку i, но затем выполняете полную замену всего столбца. Исправление было бы добавить [i] в соответствующих местах вашей последней строки кода:

gs_catalog_Staging_123$Path[i] <- gsub(Pattern , Replacement , gs_catalog_Staging_123$Path[i] ,ignore.case=T)
...