Рассмотрим три взаимно независимых классификатора A, B, C с равными вероятностями ошибки: - PullRequest
0 голосов
/ 07 февраля 2019

Вот проблема:

Рассмотрим три взаимно независимых классификатора, A, B, C, с равными вероятностями ошибок:

Pr (errA) =Pr (errB) = Pr (errC) = t

Пусть D - еще один классификатор, который получает большинство голосов A, B и C.

• Что такое Pr (errD)?

• График Pr (errD) как функция от t.

• Для каких значений t производительность D лучше, чем у любого из трех других классификаторов?



Мои вопросы:

(1) Я не мог понять вероятность ошибки D. Я думал, что это будетбыть 1 минус альфа (1 - α), но я не уверен.

(2) Как построить t (Pr (errD))?Я предполагаю, что, не найдя Pr (errD), я могу построить его.

(3) Здесь я также не мог понять это.Сравнительно, как я должен определить производительность D?

1 Ответ

0 голосов
/ 09 февраля 2019

Если я хорошо понимаю, ваша проблема может быть сформулирована простыми терминами без какого-либо обучения ансамблю.

Учитывая, что D является результатом голосования 3 классификаторами, D неверно, если и только если не более одного из оценщиков является правильным.

A,B,C являются независимыми, так:

  • вероятность того, что кто-то не прав, равна t ^ 3

  • вероятность того, что один прав, а два других неправы,3 (1-t) t ^ 2 (фактор 3 заключается в том, что для этого есть три способа)

Итак, P (errD) = t ^ 3 + 3 (1-t) t ^ 2 = -2t ^ 3 + 3t ^ 2

Вы должны быть в состоянии построить это как функцию от t в интервале [0: 1] без особых затруднений.

Что касается вашего третьего вопроса, просто решите P (errA) - P (errD)> 0 (это означает, что вероятность ошибки D меньше, чем для A, и поэтому ее производительность выше).Если вы решите это, вы обнаружите, что условие t <0,5. </p>

Чтобы вернуться к изучению ансамбля, обратите внимание, что допущение независимости между вашими оценщиками обычно не проверяется на практике.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...