Доступ к элементам объекта серии без использования индекса python, доступа к значениям корреляции или другим матрицам - PullRequest
1 голос
/ 17 февраля 2020

У меня есть датафрейм df. Я взял его корреляцию, а затем обнаружил первые четыре высоко коррелированных значения. Эти значения я назвал соответствующими характеристиками. Я sh для доступа к значениям этих соответствующих функций (соответствующие функции - объект серии)

correlation_matrix=df.corr()    #taking correlation of the df
cor_target=abs(correlation_matrix['median_house_value'])  #finding the correlation of all variables\
#against median housing value

#Selecting 4 of the most correlated features
relevant_features = cor_target.sort_values(ascending=False).head(4)
relevant_features

Вывод:

median_house_value    1.000000
median_income         0.688075
income_cat            0.553377
latitude              0.144160
Name: median_house_value, dtype: float64
:,4

Я получаю выше 4 функции, которые имеют максимальную корреляцию с медианной стоимостью жилья, как указано выше. Теперь я хочу получить доступ к значениям 1.000,0.688075, 0.553377 и т. Д. c. В основном это первый столбец.

Я попробовал следующие коды:

[IN] relevant_features[:,4]
[OUT]ValueError: Can only tuple-index with a MultiIndex

[IN] relevant_features.iloc[:,1]
[OUT]IndexingError: Too many indexers

[IN] relevant_features.loc[[0,1,2,3]]
[OUT]KeyError: "None of [Int64Index([0, 1, 2, 3], dtype='int64')] are in the [index]"

[IN] relevant_features[:,3]
[OUT]ValueError: Can only tuple-index with a MultiIndex

Я прочитал много вопросов и ответов и статьи, но это не помогает мне.

[IN]type(relevant_features)
[OUT]pandas.core.series.Series

1 Ответ

2 голосов
/ 17 февраля 2020

Вы действительно близко, нужно:

relevant_features.iloc[:4].to_numpy()
...