Как построить гистограмму серии списков панд - PullRequest
0 голосов
/ 06 ноября 2019

Я пытаюсь построить гистограмму, которая показывает частоту genre_ids в данных фильма. В настоящее время данные хранятся в виде списка идентификаторов в столбце данных pandas, поскольку некоторые фильмы имеют несколько жанров и выглядят следующим образом:

genre_ids
[35]                         
[18]                          
[35, 10749]                   
[18, 10749]                   
[35, 18, 10749] 

Как построить гистограмму так, чтобы значения на оси былитолько идентификаторы жанра индивидуально, а не сами списки? Я всюду искал этот вопрос и не мог понять его. Пока что я просто использую:

movie_data['genre_ids'].hist()

Где movie_data - фрейм данных. И я хочу, чтобы гистограмма выглядела так:

x
x   x  
x   x  x
35 18 10749 

Вместо:

x
x              x
x      x       x      x
[35] [18,35] [18] [18,10749]  

например

1 Ответ

0 голосов
/ 06 ноября 2019

Перед выполнением гистограммы необходимо выделить элементы из списков.

Это должно сделать работу:

form Pandas import Series
movie_data['genre_ids'].apply(Series).stack().hist()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...