Question

При использовании EmpiricalCovariance для разработки ковариационной матрицы для многомерных данных я бы ожидал, что диагональ этой матрицы (от верхнего левого до нижнего правого) будет равна единице, поскольку, конечно, переменная всегда буду идеально соотносить себя. Однако, это не так. Почему нет?

Вот пример, построенный с помощью тепловой карты морского рога:

Как видите, диагональ легче большинства данных, однако она не такая легкая, как самая легкая точка.

bubble · Answer 1 · 27 апреля 2019

Если вы посмотрите на реализацию класса EmpiricalCovariance и утилиту функцию , которую она вызывает, вы увидите, что np.cov(data, bias=1) (почти) совпадает с EmpiricalCovariance.fit(...).covariance_.

Давайте проведем несколько экспериментов:

from sklearn.covariance import EmpiricalCovariance
import numpy as np

np.random.seed(10)
data = np.random.rand(10, 10)
np.allclose(EmpiricalCovariance().fit(data).covariance_, np.cov(data.T, bias=1))
# returns True !

Из официальных документов numpy вы можете видеть, что диагональные элементы ковариационной матрицы - это дисперсии строк:

np.isclose(np.var(data[0]), np.cov(data, bias=1)[0][0])
# returns TRUE

Почему EmpiricalCovariance не выводит матрицу с постоянной диагональю?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Почему EmpiricalCovariance не выводит матрицу с постоянной диагональю?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы