Я работаю над своим первым проектом больших данных для моего университета.Вот мой набор данных: https://www.kaggle.com/carolzhangdc/imdb-5000-movie-dataset
В этой части я хотел бы:
- Взять только 20 лучших переменных этого конкретного столбца (IMDB Score and Gross)
- Постройте все, чтобы увидеть график.
С помощью этого кода я могу видеть график, как показано 
Top20 = newmovieDef[['IMDB Score', 'Gross']].sort_values('IMDB Score', ascending=False).nlargest(20, 'IMDB Score')
newmovieDef[['IMDB Score', 'Gross']].sort_values('IMDB Score', ascending=False).nlargest(20, 'IMDB Score')
#visualizing top 20 in plot
plt.figure(figsize=(7,7))
x = Top20["IMDB Score"]
y = Top20["Gross"]
plt.bar(x, y, color="purple")
plt.show()
Ноесли тогда я напишу это:
#GROSS-DURATION ---PROBLEMA GRAFICO
Top20 = newmovieDef[['Gross', 'Duration']].sort_values('Gross', ascending=False).nlargest(20, 'Gross')
newmovieDef[['Gross', 'Duration']].sort_values('Gross', ascending=False).nlargest(20, 'Gross')
#visualizing top 20 in plot
plt.figure(figsize=(7,7))
x = Top20["Gross"]
y = Top20["Duration"]
plt.bar(x, y, color="green")
plt.show()
, это даст мне пустой график, как в 