Я склонен рассматривать корреляцию против ковариации как противопоставление между быстрым сухим математическим обзором отношений и более необработанным анализом отношений .Представьте, что вы присоединяетесь к проекту в области, о которой вы почти ничего не знаете:
- , если член команды даст вам коэффициент корреляции для двух ключевых переменных / индикаторов, связанных с проектом, вы сможете извлечь всеинформация из этого коэффициента немедленно, не зная выборки соответствующих масштабов
- , если он дает вам ковариацию, вы, вероятно, захотите взглянуть на данные, чтобы точно оценить, что они подразумевают
Ковариантность легко понять, когда сравниваемые образцы живут в одинаковом масштабе / имеют сходную природу, поскольку значение, которое вы будете рассматривать, не будет пытаться сравнить две совершенно разные вещи с интуитивно абсурдным компромиссом в природе / масштабе (помните, что для вычисления ковариации вы используете произведения двух вещей, которые могут сильно отличаться от (x-mean(x))(y-mean(y))
).При стандартизации корреляции проблемы, связанные с различными масштабами и характером данных, просто отсутствуют в вашем индикаторе, что приводит к ощущению «более легкой интерпретации».
Следовательно, следует понимать, что , хотя корреляция может облегчить понимание математических отношений, она запутывает фактическую природу данных, с которыми вы играете. Просмотр обоих не может повредитьВы цените то, что происходит с вашими образцами, и, вероятно, поэтому вам понравится и то, и другое.Если вы не уверены, что вы также можете прочитать этот связанный вопрос stats.stackexchange .
На случай, если вам интересно, почему вы хотите сохранять близость к характеру и масштабам ваших данных при попыткечтобы выделить отношения между образцами, хорошим примером будут усилия, предпринятые в AI для извлечения полезных функций из изображений для подачи моделей: вы хотите подчеркнуть дискриминационные описания данных, не отфильтровывая другую потенциально интересную информацию с помощью стандартизации.См., Например, этот документ , который использует ковариационные матрицы для построения словаря на изображениях.