Question

Я пытаюсь построить гистограмму, которая показывает частоту genre_ids в данных фильма. В настоящее время данные хранятся в виде списка идентификаторов в столбце данных pandas, поскольку некоторые фильмы имеют несколько жанров и выглядят следующим образом:

genre_ids
[35]                         
[18]                          
[35, 10749]                   
[18, 10749]                   
[35, 18, 10749]

Как построить гистограмму так, чтобы значения на оси былитолько идентификаторы жанра индивидуально, а не сами списки? Я всюду искал этот вопрос и не мог понять его. Пока что я просто использую:

movie_data['genre_ids'].hist()

Где movie_data - фрейм данных. И я хочу, чтобы гистограмма выглядела так:

x
x   x  
x   x  x
35 18 10749

Вместо:

x
x              x
x      x       x      x
[35] [18,35] [18] [18,10749]

например

Ram · Answer 1 · 06 ноября 2019

Перед выполнением гистограммы необходимо выделить элементы из списков.

Это должно сделать работу:

form Pandas import Series
movie_data['genre_ids'].apply(Series).stack().hist()

Как построить гистограмму серии списков панд

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как построить гистограмму серии списков панд

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов