Я пытаюсь получить заголовки столбцов моего набора данных из другого файла данных.Я понятия не имею, что я делаю, но я сделал это до получения имен столбцов, но есть еще куча конечной информации, от которой я не знаю, как избавиться.
Это моя попытка:
library(readr)
d <-read_lines(url("https://archive.ics.uci.edu/ml/machine-learning- databases/adult/adult.names"))
d <- d[97:110]
head(d,1)
tail(d,13)
library(stringr)
d <- str_trim(d)
tgtLines <-sapply(1:13,function(i)
d[grep(paste0("^",i),d)[1]])
head(tgtLines,1)
nms <-str_split_fixed (tgtLines," ",1)[,1]
head(nms,2)
nms <-str_split_fixed(nms,":",13)[,1]
head(nms,1)
tail(nms,2)
Все, что мне нужно, это имена перед двоеточиями.Как "age", "workclass" .. "native_country"
Это самое близкое, что я мог получить:
[1] "age: continuous."
[1] "workclass: Private, Self-emp-not-inc, Self-emp-inc, Federal-gov, Local-gov, State-gov, Without-pay, Never-worked."
[2] "fnlwgt: continuous."
и т. Д.