анализировать самые высокие данные на линейном графике - PullRequest
0 голосов
/ 08 мая 2020
 df <- read.csv ('https://raw.githubusercontent.com/ulklc/covid19- 
  timeseries/master/countryReport/raw/rawReport.csv',
            stringsAsFactors = FALSE)
  df1 <- aggregate(death ~ countryName, subset(df), sum)

Я создал набор данных с количеством смертей.

Отображение количества смертей в 5 странах с наибольшим количеством смертей в виде линейного графика.

1 Ответ

0 голосов
/ 08 мая 2020

Импорт ggplot2

library(ggplot2)
df <- read.csv ('https://raw.githubusercontent.com/ulklc/covid19-timeseries/master/countryReport/raw/rawReport.csv', stringsAsFactors = FALSE)
df1 <- aggregate(death ~ countryName, subset(df), sum)

Выбрать 10 лучших стран из df1

top_10_coutries <- df1[order(df1$death,decreasing = T),][1:10,]$countryName

Выбрать подмножество df с названием страны в top_10_countries

to_plot = df[df$countryName %in% top_10_coutries,]

График:

ggplot(data=to_plot, aes(x=day, y=death, group=countryName)) +
  geom_line(aes(color=countryName))+
  geom_point(aes(color=countryName))+ theme(axis.title.x=element_blank(),
                                          axis.text.x=element_blank(),
                                          axis.ticks.x=element_blank())

Тема состоит в том, чтобы удалить метки даты на оси x, так как было слишком тесно

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...