Пределы и Перерывы - PullRequest
       33

Пределы и Перерывы

0 голосов
/ 16 октября 2018

введите описание изображения здесь

По этому вопросу я смог разбить данные на две гистограммы, одна из которых - доход выше медианы, а другая - доход ниже медианы.Следующий код - это то, что я сделал до сих пор:

library(openintro)
data("countyComplete")
attach("countyComplete")

median(median_household_income, na.rm = FALSE)

x<-subset(countyComplete,median_household_income > 42445)
y<-subset(countyComplete,median_household_income < 42445)

par(mfrow=c(1,2))
hist(x$median_household_income, main="Income Above Median" )
hist(y$median_household_income,main = "Income Below Median")

Однако меня немного смущает вопрос о том, как заставить гистограммы использовать одинаковые ограничения по оси y, а также разрывы.Может ли кто-то указать мне в правильном направлении.Я попытался сделать это:

par(mfrow=c(1,2))
hist(x$median_household_income,
     breaks=seq(0,100,by=5),
     freq = FALSE,
     ylim=c(0,.15),
     xlim = range(breaks),
     main="Income Above Median")
hist(y$median_household_income, main = "Income Below Median")

Но я получаю только одну гистограмму, отображаемую на экране моего графика, и консоль говорит: «Ошибка в hist.default (x $ median_household_income, breaks = seq (0, 100,: некоторые «x» не учитываются, возможно, «перерывы» не охватывают диапазон «x» ».

Что мне делать?

1 Ответ

0 голосов
/ 17 октября 2018

Я бы забыл аргумент breaks.Это не имеет смысла, вы строите значения ниже и выше медианы, они не пересекаются.

Что касается гистограмм, я предварительно рассчитал медиану и максимальное значение плотности.

library(openintro)
data("countyComplete")

med <- median(countyComplete$median_household_income, na.rm = FALSE)

x <- subset(countyComplete, median_household_income > med)
y <- subset(countyComplete, median_household_income < med)

hx <- hist(x$median_household_income, plot = FALSE)
hy <- hist(y$median_household_income, plot = FALSE)
MaxY <- max(c(hx$density, hy$density))

op <- par(mfrow = c(1, 2))
hist(x$median_household_income, main = "Income Above Median",
     freq = FALSE, ylim = c(0, MaxY))
hist(y$median_household_income, main = "Income Below Median",
     freq = FALSE, ylim = c(0, MaxY))
par(op)
...