Построение двух переменных в виде линий с использованием ggplot2 на одном графике - PullRequest
273 голосов
/ 23 сентября 2010

Очень новенький вопрос, но, скажем, у меня есть такие данные:

test_data <-
  data.frame(
    var0 = 100 + c(0, cumsum(runif(49, -20, 20))),
    var1 = 150 + c(0, cumsum(runif(49, -10, 10))),
    date = seq(as.Date("2002-01-01"), by="1 month", length.out=100)
  )

Как я могу построить оба временных ряда var0 и var1 на одном графике, с date наось х, используя ggplot2?Бонусные баллы, если вы делаете var0 и var1 разных цветов и можете добавить легенду!

Я уверен, что это очень просто, но я не могу найти никаких примеров.

Ответы [ 6 ]

341 голосов
/ 23 сентября 2010

Для небольшого количества переменных вы можете самостоятельно построить график:

ggplot(test_data, aes(date)) + 
  geom_line(aes(y = var0, colour = "var0")) + 
  geom_line(aes(y = var1, colour = "var1"))
336 голосов
/ 23 сентября 2010

Общий подход заключается в преобразовании данных в длинный формат (используя melt() из пакета reshape или reshape2) или gather() из пакета tidyr:

library("reshape2")
library("ggplot2")

test_data_long <- melt(test_data, id="date")  # convert to long format

ggplot(data=test_data_long,
       aes(x=date, y=value, colour=variable)) +
       geom_line()

ggplot2 output

29 голосов
/ 20 сентября 2016

Вам нужно, чтобы данные были в «высоком» формате, а не в «широком» для ggplot2.«широкий» означает наличие наблюдения на строку с каждой переменной в виде отдельного столбца (как у вас сейчас).Вам необходимо преобразовать его в «высокий» формат, где у вас есть столбец, в котором указано имя переменной, и другой столбец, в котором указано значение переменной.Процесс перехода от широкого к высокому обычно называют «таянием».Вы можете использовать tidyr::gather, чтобы растопить ваш фрейм данных:

library(ggplot2)
library(tidyr)

test_data <-
  data.frame(
    var0 = 100 + c(0, cumsum(runif(49, -20, 20))),
    var1 = 150 + c(0, cumsum(runif(49, -10, 10))),
    date = seq(as.Date("2002-01-01"), by="1 month", length.out=100)
  )
test_data %>%
    gather(key,value, var0, var1) %>%
    ggplot(aes(x=date, y=value, colour=key)) +
    geom_line()

multiple series ggplot2

Просто чтобы понять, data что ggplot потребляетпосле передачи через gather выглядит так:

date        key     value
2002-01-01  var0    100.00000
2002-02-01  var0    115.16388 
...
2007-11-01  var1    114.86302
2007-12-01  var1    119.30996
12 голосов
/ 23 сентября 2010

Используя ваши данные:

test_data <- data.frame(
var0 = 100 + c(0, cumsum(runif(49, -20, 20))),
var1 = 150 + c(0, cumsum(runif(49, -10, 10))),
Dates = seq.Date(as.Date("2002-01-01"), by="1 month", length.out=100))

Я создаю составленную версию, с которой ggplot() хотел бы работать:

stacked <- with(test_data,
                data.frame(value = c(var0, var1),
                           variable = factor(rep(c("Var0","Var1"),
                                                 each = NROW(test_data))),
                           Dates = rep(Dates, 2)))

В этом случае получение stacked было довольно простым, поскольку нам нужно было всего лишь выполнить пару манипуляций, но reshape() и reshape и reshape2 могут быть полезны, если у вас есть более сложные реальные данные, установленные в манипулировать.

Как только данные представлены в этой суммированной форме, требуется всего лишь простой вызов ggplot(), чтобы создать требуемый график со всеми дополнительными функциями (одна из причин, по которой такие высокоуровневые пакеты построения графиков, как lattice и ggplot2 полезно):

require(ggplot2)
p <- ggplot(stacked, aes(Dates, value, colour = variable))
p + geom_line()

Я оставлю это вам, чтобы привести в порядок метки осей, заголовок легенды и т. Д.

НТН

4 голосов
/ 23 января 2019

Я также новичок в R, но, пытаясь понять, как работает ggplot, я думаю, у меня есть другой способ сделать это. Я просто поделюсь, вероятно, не как совершенное идеальное решение, а добавлю несколько разных точек зрения.

Я знаю, что ggplot лучше работает с фреймами данных, но иногда может быть полезно знать, что вы можете напрямую построить два вектора без использования фрейма данных.

Загрузка данных. Исходная длина вектора даты равна 100, тогда как var0 и var1 имеют длину 50, поэтому я отображаю только доступные данные (первые 50 дат).

var0 <- 100 + c(0, cumsum(runif(49, -20, 20)))
var1 <- 150 + c(0, cumsum(runif(49, -10, 10)))
date <- seq(as.Date("2002-01-01"), by="1 month", length.out=50)    

Заговор

ggplot() + geom_line(aes(x=date,y=var0),color='red') + 
           geom_line(aes(x=date,y=var1),color='blue') + 
           ylab('Values')+xlab('date')

enter image description here

Однако я не смог добавить правильную легенду, используя этот формат. Кто-нибудь знает как?

0 голосов
/ 02 марта 2019

@ Папалагуи, цвет должен быть в aes, чтобы он был частью легенды.Как это:

geom_line(aes(x=date,y=var0,color='red'))
...