Question

Я использую метод DataFrame.corr () из Pandas.В результате он возвращает матрицу корреляции, но удаляет столбцы, где было хотя бы одно значение Nan.Можно ли вычислить корреляцию в DataFrame с Nan?

Rubens_Zimbres · Answer 1 · 10 мая 2018

Сначала нужно избавиться от значений NaN:

df2=df.dropna()

Или заменить их на среднее:

df2 = df.fillna(df.mean())

Или используйте алгоритм, такой как EM (максимизация ожидания) для вменения.

Затем вы проверяете корреляции

df2.corr()

Примечание: если показатель пропущенных значений для данной переменной превышает 15%, вам следует рассмотреть возможность ее исключения из анализа

Karolina Cabaj · Answer 2 · 10 мая 2018

Попробуй это.Для моего случая это сработало

 df = df.apply(pd.to_numeric, errors='coerce')

Как определить корреляцию из фрейма данных с Nan?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как определить корреляцию из фрейма данных с Nan?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы