Анализ на основе жанров: создание тепловой карты на основе логических значений разных столбцов (жанров) за разные годы и сгруппированных по доходам - PullRequest
0 голосов
/ 02 апреля 2019

Я новичок в Python. Я работаю с набором данных о фильмах с разными переменными.

Я хочу создать тепловую карту, которая показывает средний доход для каждого жанра в каждом году.

Я создал логические значения для каждого жанра и попытался использовать Groupby и Pivot.

У меня около 15 жанров, поэтому я попытался создать список с помощью Groupby, но это не сработало.

Я поместил колонки жанра в список.

new_gyGross = Relevant_Columns.pivot_table (index = ['release_date_year'], столбцы = Genre_List, значения = 'выручка', aggfunc = np.mean)

Я хочу, чтобы ось X показывала названия столбцов, но они показывают только 0 и 1

Вот как это выглядит:
enter image description here

Ideal. Я хочу что-то вроде этого
enter image description here

Однако второе изображение занимает только один жанр (в алфавитном порядке) на строку, а некоторые фильмы имеют несколько жанров. Итак, если фильм - боевик, комедия; это будет считаться только как действие, где я также хочу учитывать комедию.

Вот как выглядит мой df:
Dataframe
enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...