У меня есть датафрейм df. Я взял его корреляцию, а затем обнаружил первые четыре высоко коррелированных значения. Эти значения я назвал соответствующими характеристиками. Я sh для доступа к значениям этих соответствующих функций (соответствующие функции - объект серии)
correlation_matrix=df.corr() #taking correlation of the df
cor_target=abs(correlation_matrix['median_house_value']) #finding the correlation of all variables\
#against median housing value
#Selecting 4 of the most correlated features
relevant_features = cor_target.sort_values(ascending=False).head(4)
relevant_features
Вывод:
median_house_value 1.000000
median_income 0.688075
income_cat 0.553377
latitude 0.144160
Name: median_house_value, dtype: float64
:,4
Я получаю выше 4 функции, которые имеют максимальную корреляцию с медианной стоимостью жилья, как указано выше. Теперь я хочу получить доступ к значениям 1.000,0.688075, 0.553377 и т. Д. c. В основном это первый столбец.
Я попробовал следующие коды:
[IN] relevant_features[:,4]
[OUT]ValueError: Can only tuple-index with a MultiIndex
[IN] relevant_features.iloc[:,1]
[OUT]IndexingError: Too many indexers
[IN] relevant_features.loc[[0,1,2,3]]
[OUT]KeyError: "None of [Int64Index([0, 1, 2, 3], dtype='int64')] are in the [index]"
[IN] relevant_features[:,3]
[OUT]ValueError: Can only tuple-index with a MultiIndex
Я прочитал много вопросов и ответов и статьи, но это не помогает мне.
[IN]type(relevant_features)
[OUT]pandas.core.series.Series