Я учитель и пытаюсь сделать так, чтобы поле в R соответствовало нашим расчетам «от руки» с использованием TI-83 или Ti-84.
Данные:
myData<- data.frame(Year=c(1450, 1162, 1360, 1320, 1456, 1035, 1360,
1225, 1200, 1325, 1506, 1345, 1570, 1162,
600, 776, 800))
5-значная сводка этого в TI-83 исходит из исключения медианы при расчете квартилей.
{600, 1098.5, 1320, 1405, 1570}
Сводная таблица из 5 чисел (используемая как boxplot (), так и geom_boxplot () в ggplot2):
> summary(myData$Year)
Min. 1st Qu. Median Mean 3rd Qu. Max.
600 1162 1320 1215 1360 1570
Расхождение связано с другим стилем вычисления Q1 и Q3 (калькулятор TI не учитывает медиану, а две функции R - нет).
Мне бы хотелось, чтобы любая из функций боксплота R не использовала медиану, чтобы два итога совпадали, и результирующий блокпост выглядел бы так же, как если бы он делал «вручную» из TI-83.
(Сохранение отсечки для выбросов по-прежнему на уровне 1,5 * IQR от каждого квартиля ... Должен быть один выброс на нижней стороне, если метод квартиля соответствует TI-83. Обе эти функции R приводят ккоробочный участок, показывающий 3 выброса).
ggplot(myData, aes(y=Year)) +
geom_boxplot()
Предложения?