Другие уже отмечали, что реальные бокс-участки не будут работать хорошо.Тем не менее, - это очень эффективный способ визуального сканирования всех ваших переменных: Просто нанесите их распределения в виде изображения (то есть, тепловая карта).Вот пример, показывающий, как действительно легко получить суть из 400 переменных и 80 000 отдельных точек данных!
# Simulate some data
set.seed(12345)
n.var = 400
n.obs = 200
data = matrix(rnorm(n.var*n.obs), nrow=n.obs)
# Summarize data
breaks = seq(min(data), max(data), length.out=51)
histdata = apply(data, 2, function(x) hist(x, plot=F, breaks=breaks)$counts)
# Plot
dev.new(width=4, height=4)
image(1:n.var, breaks, t(histdata), xlab='Variable Index', ylab='Histogram Bin')
Это будет наиболее полезно, если все вашипеременные сравнимы или, по крайней мере, отсортированы по рациональным группам.Функции hclust
и heatmap
также могут быть полезны для более сложных дисплеев.Удачи!