Важность ковариации - PullRequest
       9

Важность ковариации

0 голосов
/ 18 февраля 2019

Если я рассчитал коэффициент корреляции, у меня уже есть идея ковариации.Но я видел, как многие специалисты по данным вычисляют ковариацию после нее.Если у меня есть коэффициент корреляции со мной, я могу сказать, что данные положительно или отрицательно коррелируют с силой, в то время как ковариация дает то же самое без силы.Тогда какова важность ковариации, если у меня есть коэффициент корреляции.

Пожалуйста, примите извинения, если мой вопрос имеет низкое значение.

Ответы [ 2 ]

0 голосов
/ 03 апреля 2019

Я склонен рассматривать корреляцию против ковариации как противопоставление между быстрым сухим математическим обзором отношений и более необработанным анализом отношений .Представьте, что вы присоединяетесь к проекту в области, о которой вы почти ничего не знаете:

  • , если член команды даст вам коэффициент корреляции для двух ключевых переменных / индикаторов, связанных с проектом, вы сможете извлечь всеинформация из этого коэффициента немедленно, не зная выборки соответствующих масштабов
  • , если он дает вам ковариацию, вы, вероятно, захотите взглянуть на данные, чтобы точно оценить, что они подразумевают

Ковариантность легко понять, когда сравниваемые образцы живут в одинаковом масштабе / имеют сходную природу, поскольку значение, которое вы будете рассматривать, не будет пытаться сравнить две совершенно разные вещи с интуитивно абсурдным компромиссом в природе / масштабе (помните, что для вычисления ковариации вы используете произведения двух вещей, которые могут сильно отличаться от (x-mean(x))(y-mean(y))).При стандартизации корреляции проблемы, связанные с различными масштабами и характером данных, просто отсутствуют в вашем индикаторе, что приводит к ощущению «более легкой интерпретации».

Следовательно, следует понимать, что , хотя корреляция может облегчить понимание математических отношений, она запутывает фактическую природу данных, с которыми вы играете. Просмотр обоих не может повредитьВы цените то, что происходит с вашими образцами, и, вероятно, поэтому вам понравится и то, и другое.Если вы не уверены, что вы также можете прочитать этот связанный вопрос stats.stackexchange .

На случай, если вам интересно, почему вы хотите сохранять близость к характеру и масштабам ваших данных при попыткечтобы выделить отношения между образцами, хорошим примером будут усилия, предпринятые в AI для извлечения полезных функций из изображений для подачи моделей: вы хотите подчеркнуть дискриминационные описания данных, не отфильтровывая другую потенциально интересную информацию с помощью стандартизации.См., Например, этот документ , который использует ковариационные матрицы для построения словаря на изображениях.

0 голосов
/ 28 февраля 2019

Корреляция и ковариация связаны строго, действительно rho=cov(x,y)/(sigma_x*sigma_y)

Однако единицы ковариации трудно интерпретировать.Например, если бы мы хотели знать ковариацию между заработной платой, выплачиваемой работникам, и количеством работников в фирме, то можно показать, что, переводя заработную плату из долларов в центы, мы увеличили бы ковариацию в 100 раз.странно, учитывая, что основные отношения не должны отличаться, если речь идет о долларах или центах.Еще один способ выразить это:

Cov(a*X,Y)=a*Cov(X,Y)

Корреляция всегда ограничена от -1 до 1 и ее легче интерпретировать

...