В проекте машинного обучения у меня есть некоторые обучающие данные о клиентах компании, которые включают в себя 20 функций ввода и метку, отражающую отзывы клиентов о маркетинговой кампании в виде Да / Нет ответов:
c1 => {f1_1,f2_1,...,f20_1} {Yes}
c2 => {f1_2,f2_2,...,f20_2} {No}
Требуется предсказать «вероятность принятия» каждого клиента в кампании.
Итак, данные обучения имеют двоичную классификацию , в то время как требованием является регрессионное прогнозирование .
Мне удалось извлечь величину корреляции каждого признака с классификационной меткой.
имеет смысл применять так называемые весовые коэффициенты важности к признакам, основанным на степени их корреляции с меткой классификации, и применять эти весовые коэффициенты к значениям признаков, чтобы получить что-то вроде коэффициент оценки для каждого клиента и использовать их в качестве метки регрессии?
c1_score = w1(f1_1) + w2(f2_1) + ... + w20(f20_1)
c2_score = w1(f1_2) + w2(f2_2) + ... + w20(f20_2)
Если нет, есть ли другие предложения?