Я хочу сделать диаграмму с накоплением площадей, которая показывает долю жанров фильмов, выпущенных в год. Пытаясь корректно обработать данные (надеюсь, что когда я пойму, как правильно отформатировать данные, я смогу построить график). Как мне сделать так, чтобы у меня было количество выпусков каждого жанра по годам?
Мой фрейм данных должен показывать год, а затем x количество выпусков было драматическим, y число загадочным и так далее.
Для простоты я отфильтровал, чтобы найти наиболее распространенные жанры, однако фильтр здесь работает не так, как ожидалось.
После фильтрации переменной я не уверен, куда идти дальше.
Изо всех сил пытаюсь осмыслить шаги, но, надеюсь, это достаточно ясно ...
Заранее благодарю за любую помощь.
library(readr)
library(lubridate)
library(dplyr)
ratings <- read_csv("https://raw.githubusercontent.com/rfordatascience/tidytuesday/master/data/2019/2019-01-08/IMDb_Economist_tv_ratings.csv")
ratings$year_rel <-year(ratings$date)
ratings %>%
count(genres) %>%
arrange(desc(n)) %>%
filter(n > 100)
desired_genres <- c("Comedy, Drama", "Drama", "Action, Crime, Drama", "Action, Adventure, Drama", "Crime", "Drama")
ratings %>%
select(genres, year_rel) %>%
filter(genres %in% desired_genres) #this only shows the drama genre
#Unsure where to go from here so as to break down the releases by genre.