Пример с числами
Этот пример с числами предназначен для интуитивного понимания работы формулы Байеса:
Предположим, у нас есть 10.000 типичных обзоров. Мы рассчитываем, что мы ожидаем , что произойдет с этими 10.000 обзорами:
- 9.800 являются реальными
- 200 поддельными
Предсказать сколько отзывов классифицируются как поддельные:
- Из 9800 реальных 10% классифицируются как поддельные →
9800 * 0.10 = 980
- Из 200 поддельных 95% классифицируются как Поддельные →
200 * 0.95 = 190
980 + 190 = 1.170
классифицируются как поддельные.
Теперь у нас есть все части, которые нам нужны, чтобы рассчитать вероятность того, что отзывы являются поддельными, учитывая, что это классифицируются как:
- Все отзывы, которые классифицируются как поддельные →
1.170
- Из них фактически являются поддельными →
190
190 / 1170 = 0.1623
или 16.23%
Использование общей теоремы Байеса
Давайте настроим события. Обратите внимание, что моя версия события B
немного отличается от вашей.
P(A)
: реальный обзор P(A')
: фальшивый обзор P(B)
: Прогнозируемое реальное P(B')
: Прогнозируемое фальшивое P(A'|B')
: Вероятность того, что рецензия на самом деле является фальшивой, когда прогнозируется, что она реальная
Теперь, когда мы определили наши события, мы можем go опередить Байеса:
P(A'|B') = P(A' and B') / P(B') # Bayes' formula
= P(A' and B') / (P(A and B') + P(A' and B')) # Law of total probability
Мы также знаем следующее по адаптированной версии правила Байеса:
P(A and B') = P(A) * P(B'|A )
= 0.98 * 0.10
= 0.098
P(A' and B') = P(A') * P(B'|A')
= 0.02 * 0.95
= 0.019
Соединение частей дает:
P(A'|B') = 0.019 / (0.098 + 0.019) = 0.1623