У меня есть набор данных приблизительно из 2 миллионов строк и 45 столбцов. Я хотел бы заменить список значений в одном конкретном столбце в этом наборе данных.
Я пробовал gsub, но это занимает непомерно много времени. Мне нужно выполнить 16 замен.
Чтобы дать вам пример того, что я сделал:
setwd("C:/RStudio")
dat2 <- read.csv("2016 new.csv", stringsAsFactors=FALSE)
dat3 <- read.csv("2017 new.csv", stringsAsFactors=FALSE)
dat4 <- read.csv("2018 new.csv", stringsAsFactors=FALSE)
myfulldata <- rbind(dat2, dat3)
myfulldata <- rbind(myfulldata, dat4)
myfulldata <- myfulldata[, -c(1,5,10,11,12,13,15,20,21,22,41,42,43,44,48,50,51,52,59,61,62,64,65,66,67,68,69,70,71,72)]
gc()
myfulldata[is.na(myfulldata)] <- ""
gc()
myfulldata <- gsub("Text Being Replaced","CS1",myfulldata, fixed=TRUE)
Я связал несколько файлов, затем удалил ненужные столбцы. Суть в том, где я начинаю раздел замены строки. Я только хочу заменить дела в одном конкретном столбце. Имея это в виду, могу ли я использовать что-то отличное от gsub или что-либо, что работает лучше всего, так что я заменяю только случаи в столбце № 36 с именем Waypoint?
Большое спасибо,
Eoghan