Пытаясь понять cdplot в R - PullRequest
1 голос
/ 12 апреля 2020

Привет, у меня есть набор данных Academi c, где, если количество поднятых рук увеличивается, они получат более высокие оценки.

Метки хранятся в столбце Class1, где H представляет более высокие оценки, а L обозначает более низкие оценки.

я получил следующий график через cdplot в R, но Насколько я понимаю, похоже, что если количество поднятых рук увеличится, они получат более низкие оценки, что неправильно, но я не могу правильно понять вывод.

Пожалуйста, помогите мне понять, что говорит выходной график.

использовал следующий код -

getwd()
Reading.df <- read.csv("xAPI-Edu-Data.csv")
cdplot(Class1 ~ raisedhands,data =  Reading.df)

и получил значение ниже -

enter image description here

1 Ответ

1 голос
/ 12 апреля 2020

С другой стороны, темная полоса представляет класс H, и когда вы go приближаетесь к большему количеству поднятых рук, на оси y преобладает темная полоса, что указывает на больший класс H. Другой способ этого plot, это то же самое, что если вы разделите переменную оси X на категории и спросите пропорцию классов в каждой категории при увеличении

Например, мы используем набор данных iris и имеет два класса, setosa и другие. Мы делим непрерывную переменную Sepal.Width на порядковый номер (5 бинов) и видим распределение видов:

data = iris
data$Species = factor(ifelse(data$Species=="setosa","setosa","others"))
tab = table(data$Species,cut(data$Sepal.Width,5))
barplot(sweep(tab,2,colSums(tab),"/"),
xlab="Sepal.Width ranges",ylab="Compostion of species",
col = c("lightblue","darkblue"))
legend("topright",fill=c("lightblue","darkblue"),rownames(tab),
xpd=TRUE, horiz=TRUE,inset=c(0,-0.3))

enter image description here

Более высокие значения Sepal В широте преобладают другие виды сето. Сейчас мы делаем cdplot:

enter image description here

...