Корреляция определенно влияет на важность функции.Это означает, что, если функции сильно коррелированы, будет высокий уровень избыточности, если вы сохраните их все.Поскольку две функции взаимосвязаны, значит, изменение одной из них изменит другую.Так что нет необходимости держать их в порядке?Поскольку они, безусловно, представляют друг друга и используют несколько из них, можно надеяться, что вы сможете хорошо классифицировать свои данные.
Таким образом, чтобы удалить сильно коррелированные функции, вы можете:
(1) Использовать PCAчтобы уменьшить размерность, или
(2) Использовать дерево решений для поиска важных функций, или,
(3) Вы можете вручную выбирать функции из своих знаний (если это возможно), которыефункции более перспективны, чтобы помочь вам классифицировать ваши данные, или,
(4) Вы можете комбинировать некоторые функции с новой функцией вручную, так что, говоря о одной функции, можно исключить необходимость указывать другой набор функций каквероятно, могут быть выведены из этой единственной функции.