Как выбрать столбцы по имени, игнорируя определенные символы? - PullRequest
0 голосов
/ 02 октября 2018

Я пытаюсь извлечь данные из файла, но извлекаю только определенные столбцы на основе имени столбца.

У меня есть этот бит кода:

filepath <- ([my filepath])
files <- list.files(filepath, full.names=T)
newData <- fread(file,select=c(selectCols))

selectCols содержитсписок имен столбцов (в виде строк).Но в данных, которые я извлекаю, могут быть по-разному подчеркнутые подчеркивания в каждом файле для тех же данных.

Вот пример:

PERIOD_ID
PERIOD_ID_
_PERIOD_ID_

И так далее.Я знаю, что могу использовать gsub для изменения имен столбцов, когда данные уже извлечены:

colnames(newData) <- gsub("_","",newData)

Затем я могу выбрать по имени столбца, но, учитывая, что данных много, я не уверен, что этосамая эффективная идея.

Есть ли способ игнорировать подчеркивания или другие символы в функции fread?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...