Как исправить перекрывающиеся метки и неправильный интервал между pandas scatter_matrix? Python, блоки данных - PullRequest
0 голосов
/ 24 апреля 2020

Посмотрите код и изображение ниже, которое просто создает не очень приятный scatter_matrix из pandas. Имена меток не расположены должным образом (с разными смещениями), и метки галочек перекрываются. Как мне это исправить?

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns 

# read airBnB data
filePath = "/mnt/training/airbnb/sf-listings/sf-listings-clean.parquet"
initDF = spark.read.parquet(filePath)

# used to rename columns to shorter names
def renameCols(df, cols):
  for idx, col in enumerate(cols):
    df = df.withColumnRenamed(df.columns[idx], col)
  return df

# scatter_matrix()
fig, ax = plt.subplots()
pd.plotting.scatter_matrix(renameCols(airbnbDF.select(['price', 'host_total_listings_count', 'review_scores_rating', 'number_of_reviews', 'bathrooms']), ['price', 'listings', 'scores', 'reviews', 'bath']).toPandas())
display(fig.figure)

enter image description here

...