Я должен агрегировать (конечно, с категориальной переменной разрыва) довольно большую таблицу данных, содержащую некоторые непрерывные переменные, получая среднее значение, медиану, стандартное отклонение и межквартильный диапазон (IQR) требуемых переменных.
Первые три - это простая команда SPSS Aggregate , но я не знаю, как вычислить IQR путем агрегирования таблицы данных.
Я знаю, что мог бы вычислить IQR, используя Описательные данные (по квартилам), но, поскольку мне нужны вычисления в агрегации - это не вариант. К сожалению, использование R завершается неудачно также из-за некоторых странных обстоятельств (невозможно загрузить огромный разделенный запятыми файл в R ни с помощью base :: read.table, ни с sqldf , ни с bigmemory и ни с ff пакетами).
Любая идея приветствуется! И конечно: заранее спасибо.
П.С .: Я думал об оценке IQR путем умножения стандартного отклонения на 1,5, но этот метод не будет работать, поскольку распределения искажены, поэтому допущение нормальности не сохраняется.
P.S .: Как вы думаете, использование R в SPSS не приведет к проблемам с памятью, как при открытии набора данных в чистом R?