Предотвратить прокрутку в отдельной ячейке python - PullRequest
0 голосов
/ 29 апреля 2020
for feature in features_with_na:
data = train.copy()

# make a variable that indicates 1 if the observation was missing or 0 if not missing
data[feature] = np.where(data[feature].isnull(), 1, 0)

# calculate median sales price where the information is missing or present
data.groupby(feature)['saleprice'].median().plot.bar()
plt.title(feature)
plt.show()

Я запустил этот код для просмотра взаимосвязи между различными столбцами в моем фрейме данных pandas и продажной ценой (которая является одним из столбцов). Я хотел найти некоторую форму взаимосвязи между продажными ценами и пропущенными значениями в столбцах путем преобразования моих пропущенных значений в 1 или 0, если это не пропущенное значение. Тем не менее, я получаю много графиков, и мне приходится прокручивать отдельные ячейки, что делает его довольно сложным. Есть ли код, который позволяет мне предотвратить прокрутку конкретного, чтобы я видел все графики одновременно?

1 Ответ

0 голосов
/ 29 апреля 2020

Вы можете внести некоторые изменения в свой код и получить требуемый участок:

Скажите «Цена» = «Saleprice».

feature_data_with_na_and_Price = feature_with_na.copy()
feature_data_with_na_and_Price.append('Price')
data = train[feature_data_with_na_and_Price]

features = []  # store all the features with missing value
null_medians = []  # will store all the price where there was missing values
not_null_medians = []   # will store all the price where there was no missing values
for feature in feature_with_na:

    # make a variable that indicates 1 if the observation was missing or 0 if not missing
    data[feature] = np.where(data[feature].isnull(), 1, 0)

    # the median price for null values
    null_median = data[data[feature] == 1]['Price'].median()

    # the median price for not null values
    not_null_median = data[data[feature] == 0]['Price'].median()

    # append the median price where there is missing values in null_medians
    null_medians.append(null_median)

    # append the median price where there is no missing values in not_null_medians
    not_null_medians.append(not_null_median)

    # append the feature
    features.append(feature)

# create two different dataframes for missing values and not missing values
df1 = pd.DataFrame({'feature': features, 'Price': null_medians})
df2 = pd.DataFrame({'feature': features, 'Price': not_null_medians})

# Add hue
df1['hue']=1   # 1 means missing values
df2['hue']=0   # 0 means no missing values

# concatenate the two dataframes
df = pd.concat([df1, df2])

import seaborn as sns
plt.figure(figsize=(20,10))
sns.barplot(x='feature', y = 'Price', data = df, hue='hue')
plt.xticks(rotation=90, ha='right')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...