Класс корреляции равен Коэффициент корреляции Пирсона между классом (иначе целевая переменная или отклик) и другими характеристиками (он же независимые переменные).
Коэффициент корреляции Пирсона Абсолют Диапазон значений от 0 до 1 (1 означает идеальное отношение).
Например, в вашем наборе данных Iris есть 3 класса (т.е. вид Iris), а именно: Setosa, Versicolour и Virginica .
С другой стороны, у вас есть 4 функций , а именно: длина чашелистика, ширина чашелистика, длина лепестка и ширина лепестка .
Хорошо найти корреляцию между классом сверху и одной из функций в наборе данных ... Почему?Чтобы увидеть, сколько эта особенность / атрибут стоит для класса.Другими словами, надежность класса по этому признаку.
Например, из вашего набора данных ширина лепестка имеет самую высокую корреляцию с классами (corr=0.9565
), что означает: изменения ширины лепестка в значительной степени вызывают изменения в классахлинейно!
Таким образом, в результате функция ширина лепестка очень важна для моделирования набора данных, а также для прогнозирования любого будущего невидимого нового примера!
То же самое для длина лепестка , которая имеет очень высокую корреляцию с другими классами.
Как правило, абсолютное значение корреляции Пирсона можно интерпретировать какследующие:
- Слабые: от 0,1 до 0,29
- Средние: от 0,3 до 0,49
- Сильные: от 0,5 до 1
иэто в соответствии со Стандартом Коэна.