Я тоже участвовал в таком же соревновании на kaggle. Для регрессий я бы использовал go для диаграммы рассеяния:
import matplotlib as plt
plt.plot(x,y)
Что касается визуализации этого конкретного соревнования, я бы использовал следующий код:
# visualising some more outliers in the data values
fig, axs = plt.subplots(ncols=2, nrows=0, figsize=(12, 120))
plt.subplots_adjust(right=2)
plt.subplots_adjust(top=2)
sns.color_palette("husl", 8)
for i, feature in enumerate(list(train[numeric]), 1):
if(feature=='MiscVal'):
break
plt.subplot(len(list(numeric)), 3, i)
sns.scatterplot(x=feature, y='SalePrice', hue='SalePrice', palette='Blues', data=train)
plt.xlabel('{}'.format(feature), size=15,labelpad=12.5)
plt.ylabel('SalePrice', size=15, labelpad=12.5)
for j in range(2):
plt.tick_params(axis='x', labelsize=12)
plt.tick_params(axis='y', labelsize=12)
plt.legend(loc='best', prop={'size': 10})
plt.show()
Я действительно загрузил Полный код этого конкурса на моем GitHub, если вы хотите взглянуть;) (в настоящее время я вхожу в 14% лучших на этом конкурсе).