Посмотрите код и изображение ниже, которое просто создает не очень приятный scatter_matrix из pandas. Имена меток не расположены должным образом (с разными смещениями), и метки галочек перекрываются. Как мне это исправить?
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# read airBnB data
filePath = "/mnt/training/airbnb/sf-listings/sf-listings-clean.parquet"
initDF = spark.read.parquet(filePath)
# used to rename columns to shorter names
def renameCols(df, cols):
for idx, col in enumerate(cols):
df = df.withColumnRenamed(df.columns[idx], col)
return df
# scatter_matrix()
fig, ax = plt.subplots()
pd.plotting.scatter_matrix(renameCols(airbnbDF.select(['price', 'host_total_listings_count', 'review_scores_rating', 'number_of_reviews', 'bathrooms']), ['price', 'listings', 'scores', 'reviews', 'bath']).toPandas())
display(fig.figure)