логистическая регрессия альтернативная интерпретация - PullRequest
0 голосов
/ 28 июня 2018

Я пытаюсь проанализировать данные, которые показывают, что люди заболевают или нет. То есть ответ является двоичным. Я применил логистическую регрессию. Предположим, что результат log.reg (логистическая регрессия) подобен;

ID = c(1,2,3,4)
Test_Data = c(0,1,1,0)
Log.Reg_Output = c(0.01,0.4,0.8,0.49)
result = data.frame(ID,Test_Data,Reg_Output)

result

# 1   | 0 |  0.01  
# 2   | 1 |  0.4    
# 3   | 1 |  0.8    
# 4   | 0 |  0.49   

Могу ли я сказать, что человек с ID = 3 заразится на 80%? Это правильный подход? Если нет, то почему? Я так растерялся, любая помощь будет отличной!

Второй вопрос: как я могу рассчитать коэффициент точности, кроме округления результата модели 0 или 1. Потому что, я думаю, округление от 0,49 до 0 не столь значимо. В моем примере вывод модели будет изменяться на 0,0,1,0 вместо 0,01, 0,4, 0,8, 0,49 на основе больше или меньше 0,5. И уровень точности будет 75%. Есть ли другой метод расчета?

Спасибо!

1 Ответ

0 голосов
/ 28 июня 2018

Могу ли я сказать, что человек с ID = 3 заразится этой болезнью на 80 процентов?

Непонятно, что вы подразумеваете под "в"; традиционная / общепринятая интерпретация результатов логистической регрессии здесь , модель оценивает, что человек № 3 подхватит заболевание с вероятностью 80% . Также неясно, что вы подразумеваете под «альтернативой» в названии (вы не уточняете в теле вопроса).

как рассчитать коэффициент точности, кроме округления результата модели 0 или 1.

Точность по определению требует округления результатов модели до 0/1. Но, по крайней мере, в принципе, порог принятия решения не обязательно должен быть 0,5 ...

Потому что округление от 0,49 до 0, я думаю, не так важно.

Как вы думаете, округление от 0,49 до 1 является более значимым? Потому что это единственный альтернативный выбор в бинарной классификации (человек или заразится, или нет).

Относительно метрики потерь логарифма, упомянутой в комментариях: ее роль полностью отличается от роли точности. Вы можете найти полезные ответы на мои вопросы:

Потеря и точность - это разумные кривые обучения?

Как Keras оценивает точность? (несмотря на неверное название, он не имеет ничего общего с Keras).

Я серьезно предлагаю вам взглянуть на некоторые учебные пособия по логистической регрессии (их буквально сотни); Настоятельно рекомендуемый источник - учебник Введение в статистическое обучение (с приложениями в R) , свободно распространяемый авторами ...

...