Понял !!Хотел поблагодарить кучу офлайновых людей и Pythonistas, которые помогли мне в правильном направлении.Оказывается, я крутил свои колеса с сетами и списками, когда одна единственная команда Панд (ну, если быть точным, 3) добилась цели !!
df2 = pd.DataFrame(df.genres.str.split(', ').tolist(), index=[df.col1, df.col2, df.coln]).stack()
df2 = df2.reset_index()[[0, 'col1', 'col2', 'coln',]]
df2.columns = ['Genre', 'col1', "col2", 'coln']
Это должно создать 2-й кадр данных (df2), который имеет ключевые столбцы для анализа из исходного кадра данных и строки, дублированные / приписанные каждому жанру.Вы видите истинное значение этого, когда вы делаете оборот и делаете что-то вроде:
revenue_table = df2.pivot_table(index=['Release Year','Genre'], values=['Profit'],aggfunc={'Profit': np.sum},fill_value=0,dropna=True)
или что-то похожее с эффектом или вариантом использования.
Закрытие этого, но был бы признателен за любые заметки о более эффективных способахсделать это.