Как получить имена столбцов из файла при обрезке конечной информации - PullRequest
0 голосов
/ 25 сентября 2019

Я пытаюсь получить заголовки столбцов моего набора данных из другого файла данных.Я понятия не имею, что я делаю, но я сделал это до получения имен столбцов, но есть еще куча конечной информации, от которой я не знаю, как избавиться.

Это моя попытка:

library(readr)
d <-read_lines(url("https://archive.ics.uci.edu/ml/machine-learning-      databases/adult/adult.names"))
d <- d[97:110]
head(d,1)
tail(d,13)
library(stringr)
d <- str_trim(d)

tgtLines <-sapply(1:13,function(i)

d[grep(paste0("^",i),d)[1]])

head(tgtLines,1)

nms <-str_split_fixed (tgtLines," ",1)[,1]

head(nms,2)

nms <-str_split_fixed(nms,":",13)[,1]
head(nms,1)

tail(nms,2)

Все, что мне нужно, это имена перед двоеточиями.Как "age", "workclass" .. "native_country"

Это самое близкое, что я мог получить:

[1] "age: continuous."
[1] "workclass: Private, Self-emp-not-inc, Self-emp-inc, Federal-gov, Local-gov, State-gov, Without-pay, Never-worked."                                                                                                                                                                                                                                                                                                                              
[2] "fnlwgt: continuous."                                                                                                                                                                                                                                                                                                                                                                                                                          

и т. Д.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...