Фильтрация столбца типа «Фактор» в наборе данных? - PullRequest
0 голосов
/ 19 февраля 2019

Я пользуюсь переписью о доходах США-1994 данные о взрослых и хочу отфильтровать столбцы по уровню образования.

Я пробовал:

subset(mydata,education == "HS-grad")

, сохранив его как facotr и преобразовав его в символ даже

mydata$education <- as.character(mydata$education)

, но они не сработали

структура образования colum в mydata:

$ education     : Factor w/ 16 levels " 10th"," 11th",..: 10 12 2 10 13 7 12 13 10 16 ...

1 Ответ

0 голосов
/ 19 февраля 2019

Я попытался использовать следующий способ, и код работает нормально

data = read.table("http://archive.ics.uci.edu/ml/machine-learning-databases/adult/adult.data",
                  sep=",",header=F,col.names=c("age", "type_employer", "fnlwgt", "education", 
                                               "education_num","marital", "occupation", "relationship", "race","sex",
                                               "capital_gain", "capital_loss", "hr_per_week","country", "income"),
                  fill=FALSE,strip.white=T)


str(data)

data1 <- subset(data,education == "HS-grad")
...