Как определить корреляцию из фрейма данных с Nan? - PullRequest
0 голосов
/ 10 мая 2018

Я использую метод DataFrame.corr () из Pandas.В результате он возвращает матрицу корреляции, но удаляет столбцы, где было хотя бы одно значение Nan.Можно ли вычислить корреляцию в DataFrame с Nan?

Ответы [ 2 ]

0 голосов
/ 10 мая 2018

Сначала нужно избавиться от значений NaN:

df2=df.dropna()

Или заменить их на среднее:

df2 = df.fillna(df.mean())

Или используйте алгоритм, такой как EM (максимизация ожидания) для вменения.

Затем вы проверяете корреляции

df2.corr()

Примечание: если показатель пропущенных значений для данной переменной превышает 15%, вам следует рассмотреть возможность ее исключения из анализа

0 голосов
/ 10 мая 2018

Попробуй это.Для моего случая это сработало

 df = df.apply(pd.to_numeric, errors='coerce')
...