Я приспособил модель логистической регрессии к своим данным. Представьте, что у меня есть четыре особенности: какое условие участник получил, имел ли участник какие-либо предварительные знания / опыт работы с тестируемым явлением (бинарный ответ в постэкспериментальной анкете), время, потраченное на экспериментальное задание, и возраст участника. Я пытаюсь предсказать, выбрали ли участники в конечном итоге вариант A или вариант B. Моя логистическая регрессия выводит следующие коэффициенты функции с clf.coef_
:
[[- 0,68120795 -0,19073737 -2,50511774 0,14956844]]
Если вариант А является моим положительным классом, означает ли этот вывод, что функция 3 является наиболее важной характеристикой для двоичной классификации и имеет отрицательную связь с участниками, выбравшими вариант А (примечание: я не нормализовал / не перемасштабировал свои данные) ? Я хочу убедиться, что мое понимание коэффициентов и информации, которую я могу извлечь из них, является правильным, поэтому я не делаю никаких обобщений или ложных предположений в своем анализе.
Спасибо за вашу помощь!