Преобразуйте только одну ось в log10 масштаб с помощью ggplot2 - PullRequest
36 голосов
/ 15 января 2011

У меня есть следующая проблема: я хотел бы представить дискретную и непрерывную переменную на блокпосте, в котором последний имеет несколько экстремально высоких значений. Это делает коробочный график бессмысленным (точки и даже «тело» диаграммы слишком малы), поэтому я хотел бы показать это в масштабе log10. Мне известно, что я могу исключить крайние значения из визуализации, но я не собираюсь этого делать.

Давайте рассмотрим простой пример с данными о бриллиантах:

m <- ggplot(diamonds, aes(y = price, x = color))

alt text

Проблема здесь несерьезна, но я надеюсь, вы могли бы представить, почему я хотел бы видеть значения в масштабе log10. Давайте попробуем это:

m + geom_boxplot() + coord_trans(y = "log10")

alt text

Как вы можете видеть, ось y масштабирована по log10 и выглядит нормально, но есть проблема с осью x, которая делает график очень странным.

Проблема не возникает с scale_log, но для меня это не вариант , так как я не могу использовать пользовательский форматер таким образом. E.g.:

m + geom_boxplot() + scale_y_log10() 

alt text

Мой вопрос: кто-нибудь знает решение для построения коробчатого графика со шкалой log10 по оси Y, метки которого можно свободно форматировать с помощью функции formatter, как в этой теме ?


Редактирование вопроса, чтобы помочь ответчикам на основе ответов и комментариев:

То, что я действительно после: одна log10 трансформированная ось (y) с не научными метками. Я хотел бы обозначить его как доллар (formatter=dollar) или любой другой формат.

Если я попробую предложение @ hadley, я получу следующие предупреждения:

> m + geom_boxplot() + scale_y_log10(formatter=dollar)
Warning messages:
1: In max(x) : no non-missing arguments to max; returning -Inf
2: In max(x) : no non-missing arguments to max; returning -Inf
3: In max(x) : no non-missing arguments to max; returning -Inf

С неизменными метками оси y:

alt text

Ответы [ 4 ]

25 голосов
/ 15 января 2011

Самое простое - просто дать аргументу форматера имя функции журнала:

m + geom_boxplot() + scale_y_continuous(formatter='log10')

РЕДАКТИРОВАТЬ: Или, если вам это не нравится, то любой из них, похоже, дает тот же результат:

m <- ggplot(diamonds, aes(y = price, x = color), log="y"); m + geom_boxplot() 
m <- ggplot(diamonds, aes(y = price, x = color), log10="y"); m + geom_boxplot()

РЕДАКТИРОВАТЬ 2 & 3: Дальнейшие эксперименты (после отбрасывания того, который успешно пытался поставить знаки "$" перед зарегистрированными значениями):

fmtExpLg10 <- function(x) paste(round_any(10^x/1000, 0.01) , "K $", sep="")
ggplot(diamonds, aes(color, log10(price))) + 
 geom_boxplot() + 
 scale_y_continuous("Price, log10-scaling", formatter = fmtExpLg10)

alt text

Примечание добавлено в середине 2017 года в комментарии об изменении синтаксиса пакета:

scale_y_continuous (formatter = 'log10') теперь теперь scale_y_continuous (trans = 'log10') (ggplot2 v2.2.1)

14 голосов
/ 09 февраля 2011

У меня была похожая проблема, и этот масштаб работал для меня как шарм:

breaks = 10**(1:10)
scale_y_log10(breaks = breaks, labels = comma(breaks))

, так как вы тоже хотите промежуточные уровни (10 ^ 3.5), вам нужно настроить форматирование:

breaks = 10**(1:10 * 0.5)
m <- ggplot(diamonds, aes(y = price, x = color)) + geom_boxplot()
m + scale_y_log10(breaks = breaks, labels = comma(breaks, digits = 1))

После выполнения ::

enter image description here

3 голосов
/ 08 августа 2018

Другое решение с использованием scale_y_log10 с trans_breaks, trans_format и annotation_logticks()

library(ggplot2)

m <- ggplot(diamonds, aes(y = price, x = color))

m + geom_boxplot() +
  scale_y_log10(
    breaks = scales::trans_breaks("log10", function(x) 10^x),
    labels = scales::trans_format("log10", scales::math_format(10^.x))
  ) +
  theme_bw() +
  annotation_logticks(sides = 'lr') +
  theme(panel.grid.minor = element_blank())

0 голосов
/ 15 января 2011

Мне кажется, я наконец-то получил его, выполнив несколько ручных преобразований с данными перед визуализацией:

d <- diamonds
# computing logarithm of prices
d$price <- log10(d$price)

И разработал модуль форматирования для последующего вычисления «назад» логарифмических данных:

formatBack <- function(x) 10^x 
# or with special formatter (here: "dollar")
formatBack <- function(x) paste(round(10^x, 2), "$", sep=' ') 

И нарисуйте сюжет с указанным форматером:

m <- ggplot(d, aes(y = price, x = color))
m + geom_boxplot() + scale_y_continuous(formatter='formatBack')

alt text

Извините, что беспокою вас вопросом, который я мог бы решить раньше!Самое смешное: я усердно работал над тем, чтобы этот сюжет работал месяц назад, но мне это не удалось.Спросив здесь, я получил его.

В любом случае, спасибо @DWin за мотивацию!

...