Я пытаюсь построить гистограмму, которая показывает частоту genre_ids в данных фильма. В настоящее время данные хранятся в виде списка идентификаторов в столбце данных pandas, поскольку некоторые фильмы имеют несколько жанров и выглядят следующим образом:
genre_ids
[35]
[18]
[35, 10749]
[18, 10749]
[35, 18, 10749]
Как построить гистограмму так, чтобы значения на оси былитолько идентификаторы жанра индивидуально, а не сами списки? Я всюду искал этот вопрос и не мог понять его. Пока что я просто использую:
movie_data['genre_ids'].hist()
Где movie_data - фрейм данных. И я хочу, чтобы гистограмма выглядела так:
x
x x
x x x
35 18 10749
Вместо:
x
x x
x x x x
[35] [18,35] [18] [18,10749]
например