ggplot2 - ссылки на итоговую статистику / слои - PullRequest
4 голосов
/ 18 апреля 2011

Я поднял книгу ggplot2, но изо всех сил пытаюсь понять, как данные сохраняются в слоях.

Например, давайте возьмем набор данных и вычислим среднее значение каждого X:

thePlot = ggplot( myDF , aes_string( x = "IndepentVar" , y = "DependentVar" ) )
thePlot = thePlot + stat_summary( fun.y = mean , geom = "point" )

Как мне "получить доступ" к сводной статистике в следующем слое?Например, допустим, я хочу построить плавную линию над набором данных.Кажется, это работает:

thePlot = thePlot + stat_smooth( aes( group = 1 ) , method = "lm" , geom = "smooth" , se = FALSE )

Но допустим, я хочу еще больше игнорировать определенное значение X при генерации строки?Как мне ссылаться на суммарный набор данных для выражения, исключая конкретный X?

В более общем смысле, как на данные ссылаются, когда они проходят через слои?Я всегда ограничен последней статистикой?Могу ли я сослаться на исходный набор данных?

1 Ответ

4 голосов
/ 18 апреля 2011

Вот попытка ответить на ваш вопрос

  1. Эстетика, определенная в вызове ggplot, используется в качестве значений по умолчанию во всех последующих слоях, если они не определены явно. Вот почему geom_smooth работает
  2. Вы можете указать data frame и aesthetics для каждого слоя отдельно. Например, если вы хотите исключить некоторые значения x при построении графика geom_smooth, вы можете указать subset = .(x != xvalues) внутри geom_smooth call

Могу привести более подробные примеры, если у вас есть конкретные вопросы.

Надеюсь, это поможет

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...