Я пытаюсь извлечь данные из файла, но извлекаю только определенные столбцы на основе имени столбца.
У меня есть этот бит кода:
filepath <- ([my filepath])
files <- list.files(filepath, full.names=T)
newData <- fread(file,select=c(selectCols))
selectCols содержитсписок имен столбцов (в виде строк).Но в данных, которые я извлекаю, могут быть по-разному подчеркнутые подчеркивания в каждом файле для тех же данных.
Вот пример:
PERIOD_ID
PERIOD_ID_
_PERIOD_ID_
И так далее.Я знаю, что могу использовать gsub для изменения имен столбцов, когда данные уже извлечены:
colnames(newData) <- gsub("_","",newData)
Затем я могу выбрать по имени столбца, но, учитывая, что данных много, я не уверен, что этосамая эффективная идея.
Есть ли способ игнорировать подчеркивания или другие символы в функции fread?