Как визуализировать сохраненные данные после извлечения их из набора данных - PullRequest
0 голосов
/ 09 марта 2020

This is what I have extractedsample of original dataset

В основном я хочу извлечь максимальное значение значения жанра для каждого года, а затем отобразить его на гистограмме ответить на вопрос - Какой жанр наиболее популярен из года в год?

1 Ответ

1 голос
/ 09 марта 2020

Первая идея - создать 3 columns DataFrame с помощью # Series.reset_index, удалить дубликаты с помощью DataFrame.drop_duplicates и изменить форму на DataFrame.pivot:

df = (temp_1.reset_index(name='count')
            .drop_duplicates('release_year')
            .pivot('release_year','genres','count'))

Или удалите дубликаты в MultiIndex на Index.get_level_values с Index.duplicated и boolean indexing, измените на Series.unstack и последнее создание 3 columns DataFrame:

df = (temp_1[~temp_1.index.get_level_values('release_year').duplicated()]
            .unstack()
            .reset_index(name='count'))

Последний сюжет по DataFrame.plot.bar:

df.plot.bar()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...