У меня проблема с гистограммой плотности в ggplot2. Я работаю в RStudio и пытаюсь создать гистограмму плотности дохода, зависящей от профессии людей. Моя проблема в том, что когда я использую свой код:
data = read.table("http://archive.ics.uci.edu/ml/machine-learning-databases/adult/adult.data",
sep=",",header=F,col.names=c("age", "type_employer", "fnlwgt", "education",
"education_num","marital", "occupation", "relationship", "race","sex",
"capital_gain", "capital_loss", "hr_per_week","country", "income"),
fill=FALSE,strip.white=T)
ggplot(data=dat, aes(x=income)) +
geom_histogram(stat='count',
aes(x= income, y=stat(count)/sum(stat(count)),
col=occupation, fill=occupation),
position='dodge')
В ответ я получаю гистограмму каждого значения, деленную на общее количество всех значений всех категорий, и мне хотелось бы, например, для людей, зарабатывающих> 50 тыс., Которые занимаются «ремонтом ремесел», деленное на общее число людей, занимающихся ремеслом. -ремонт и то же самое для <= 50K и той же категории занятий, и то же самое для любого другого типа занятия </p>
И второй вопрос, после выполнения гистограммы плотности пропппера, как я могу отсортировать столбцы в порядке убывания?