Если мне дают большой набор данных со многими переменными, можно ли определить, являются ли любые два из них независимыми или зависимыми? Предположим, что я ничего не знаю о данных, кроме статистического исследования.
Может ли анализ корреляции / ковариации определить это?
Цель этого - определить, какие переменныелучше всего использовать в машинном обучении, чтобы предсказать конкретный результат. У меня есть некоторые переменные с корреляцией 0,40 - 0,50 друг с другом, но я не уверен, если высокая корреляция == зависимость.
Спасибо