Ранжирование условной вероятности классификации исследования (PLSDA), чтобы получить лучшую точность - PullRequest
0 голосов
/ 25 марта 2019

Я строю модель для прогнозирования вероятности того, что животное будет плохим или хорошим, используя PLSDA. Чувствительность и специфичность составляют 76% и 56% соответственно. Давайте пока проигнорируем чувствительность, потому что наши фермеры просто хотели, чтобы мы идентифицировали, скажем, 10% животных в их стаде, которые, скорее всего, будут бедными. Что я сделал, так это извлек условную вероятность двух классов (хороший) и 2 (плохой), а затем вычислил соотношение вероятностей от плохого к хорошему. Затем я оценил это соотношение от большого к маленькому и сохранил 10% животных, но, используя только самый высокий рейтинг, я бы сказал, что в этом случае модель более уверенно присваивает это животное классу 0 (плохое). Что я могу видеть, так это то, что сейчас 78% животных, которые, по прогнозам модели, были бедными с высокой степенью достоверности, действительно правы.

Это очень ответило на просьбу наших фермеров. Мой вопрос таков: это хороший способ сделать? Кто-нибудь практиковал такой способ?

Важно отметить, что наши фермеры не требуют, чтобы мы идентифицировали всех бедных животных, но 5-10% очень бедных животных уже настолько хороши для них.

Большое спасибо за помощь, Phuong

...