Это на самом деле дополнительный вопрос к моему предыдущему вопросу.
панд: Как построить круговую диаграмму для количества фильмов в зависимости от жанра фильмов IMDB в пандах?
В этом вопросе мы наметили количество уникальных жанров для фильмов.
Мой вопрос: как получить 'budget'
против 'genres'
сюжет в pandas
?
Вот пример кода:
import pandas as pd
import numpy as np
%matplotlib inline
df = pd.DataFrame({'movie' : ['A', 'B','C','D'],
'budget': [1000, 2000, 3000, 4000],
'genres': ['Science Fiction|Romance|Family', 'Action|Romance',
'Family|Drama','Mystery|Science Fiction|Drama']},
index=range(4))
df
Здесь жанр Science Fiction|Romance|Family
на самом деле три отдельных жанра.
* * * * * * * * * * * * * * * появляется в A
и B
, поэтому бюджет для жанра Science Fiction
должен составлять 1000+4000=5000
и т. Д.