У меня есть данные, которые в основном сосредоточены в небольшом диапазоне (1-10), но есть значительное количество точек (скажем, 10%), которые находятся в (10-1000).Я хотел бы построить гистограмму для этих данных, которая будет сосредоточена на (1-10), но также покажет данные (10-1000).Что-то вроде логарифмической шкалы для гистограммы.
Да, я знаю, это означает, что не все ячейки имеют одинаковый размер
Простой hist(x)
дает
, тогда как hist(x,breaks=c(0,1,1.1,1.2,1.3,1.4,1.5,1.6,1.7,1.8,1.9,2,3,4,5,7.5,10,15,20,50,100,200,500,1000,10000)))
дает 
ничего из того, что я хочу.
обновление , следуя приведенным здесь ответам, я теперь создаю что-то, почти то, что я хочу (я пошел с непрерывнымГрафик вместо гистограммы):
breaks <- c(0,1,1.1,1.2,1.3,1.4,1.5,1.6,1.7,1.8,1.9,2,4,8)
ggplot(t,aes(x)) + geom_histogram(colour="darkblue", size=1, fill="blue") + scale_x_log10('true size/predicted size', breaks = breaks, labels = breaks)![alt text][3]
Единственная проблема заключается в том, что я хотел бы сопоставить масштаб и фактические бары, нанесенные на график.Для этого есть два варианта: один - просто использовать фактические поля графиков (как?), Затем получить «некрасивые» метки оси X, как 1.1754, 12985 и т. Д. Другой, который я предпочитаю, - это контролировать фактическийполя полей используются так, чтобы они соответствовали перерывам.