У Элиэзера Юдковского есть (действительно, очень длинное, но хорошее) объяснение теоремы Байеса . Примерно на 70% внизу есть параграф, начинающийся с «Перед вами книжный мешок», который объясняет суть этой проблемы.
Изюминка в том, что все, что имеет значение, - это разница между количеством нарисованных красных и белых шаров. Таким образом, вопреки тому, что говорили другие, вам не нужно делать каких-либо вычислений. (Это делает одно из разумных предположений (а), что шары вытянуты с заменой , или (б) урна имеет лот шаров. Тогда количество шаров не не имеет значения.) Вот аргумент:
Напомним теорему Байеса: P (A | B) = P (B | A) * P (A) / P (B). (Примечание по терминологии: P (A) - это предшествующий , а P (A | B) - задний . B - это какое-то наблюдение, которое вы сделали, и терминология отражает вашу уверенность до и после вашего наблюдения.) С этой формой теоремы все в порядке, и @bobince и @Adam Rosenfield правильно ее применили. Однако использование этой формы напрямую делает вас подверженным арифметическим ошибкам, и в действительности это не передает теорему Байеса сердце . Адам упомянул в своем посте (и я упоминал выше), что все, что имеет значение, это разница между количеством красных и белых шаров, которые были нарисованы, потому что «все остальное в уравнениях сводится на нет». Как мы можем увидеть это без каких-либо расчетов?
Мы можем использовать понятия коэффициент шансов и коэффициент вероятности . Что такое отношение шансов? Ну, вместо того, чтобы думать о P (A) и P (¬A), мы будем думать об их соотношении P (A): P (¬A). Один из них можно восстановить из другого, но арифметика работает лучше с отношениями шансов, потому что нам не нужно нормализовать. Кроме того, легче «получить» теорему Байеса в ее альтернативной форме.
Что я имею в виду, нам не нужно нормализовать, и какова альтернативная форма? Что ж, давайте посчитаем. Теорема Байеса гласит, что задние шансы равны
P (A | B): P (¬A | B) = (P (B | A) * P (A) / P (B)): (P (B | ¬A) * P (¬A ) / P (B)).
P (B) является нормализующим фактором, чтобы сделать вероятности равными единице; однако мы работаем с коэффициентами, где шансы 2: 1 и 4: 2 - это одно и то же, поэтому P (B) отменяется. У нас есть простое выражение, которое происходит с фактором:
P (A | B): P (¬A | B) = (P (B | A) * P (A)): (P (B | ¬A) * P (¬A)) = (P (B | A): P (B | ¬A)) * (P (A): P (¬A))
Мы уже слышали о втором семестре там; это соотношение предыдущих шансов. Что такое P (B | A): P (B | ¬A)? Это называется отношение правдоподобия . Итак, наше окончательное выражение
задние шансы = отношение правдоподобия * предыдущие шансы.
Как мы применим это в этой ситуации? Хорошо, предположим, что у нас есть некоторые предыдущие коэффициенты x: y для содержимого урны, где x представляет 2 / 3rds красного цвета, а y представляет 2/3rds белого цвета. Предположим, мы нарисуем один красный шар. Отношение правдоподобия равно P (красный шарик Дрю | урна 2/3 красного цвета): P (красный шарик Дрю | урна 2/3 белого цвета) = (2/3): (1/3) = 2: 1. Таким образом, задние шансы 2x: y; если бы мы нарисовали белый шар, шансы на победу были бы равны x: 2y. Теперь мы делаем это для каждого шара в последовательности ; если розыгрыши независимы, то мы просто умножаем все коэффициенты. Таким образом, мы получаем, что если мы начнем с отношения шансов x: y и нарисуем r красных шаров и w белых шаров, мы получим окончательное отношение шансов
(x: y) * (2: 1) ^ r * (1: 2) ^ w = (x * 2 ^ r): (y * 2 ^ w) = (x: y) * (2 ^ (rw): 1).
поэтому мывидите, что все, что имеет значение, это разница между r и w. Это также позволяет нам легко решить проблему. Для первого вопроса («кто должен быть более уверенным?») Предыдущие шансы не имеют значения, если они не 1: 0 или 0: 1, и у обоих людей одинаковые приоры. Действительно, если бы их идентичный предшествующий элемент был x: y, апостериор первого человека был бы (2 ^ 3 * x): y, в то время как апостериор второго человека был бы (2 ^ 4 * x): y, так что второй человек более точно.
Кроме того, предположим, что предыдущие шансы были одинаковыми, то есть 1: 1. Тогда апостериор первого человека был бы 8: 1, в то время как шансы второго человека были бы 16: 1. Мы можем легко перевести их в вероятности 8/9 и 16/17, подтверждая другие расчеты.
Смысл в том, что если вы получите жирное уравнение, приведенное выше, тогда эта проблема будет действительно простой . Но , что не менее важно , вы можете быть уверены, что не ошиблись в арифметике, потому что вы должны делать так мало.
Так что это плохой вопрос программирования, но - это хороший тест для жирного уравнения. Просто для практики, давайте применим его еще к двум задачам:
Я случайно выбираю одну из двух монет: честную или поддельную, двуглавую, с вероятностью 50%. Я переворачиваю его три раза, и он поднимается все три раза. Какова вероятность, что это настоящая монета?
Предыдущие шансы действительны: фальшивка = 1: 1, как указано в задаче. Вероятность того, что я видел бы три головы с настоящей монетой, составляет 1/8, но это равняется 1 с поддельной монетой, поэтому отношение правдоподобия составляет 1: 8. Таким образом, задние шансы = предыдущая * вероятность = 1: 8. Таким образом, вероятность, что это настоящая монета, равна 1/9.
Эта проблема также вызывает важное предостережение: для каждого возможного наблюдения существует возможно различное отношение правдоподобия. Это связано с тем, что отношение правдоподобия для B равно P (B | A): P (B | ¬A), которое необязательно связано с отношением правдоподобия для ¬B, которое равно P (¬B | A): P (¬ B | ¬A). К сожалению, во всех приведенных выше примерах они были противоположны друг другу, но здесь это не так.
Действительно, предположим, что я подбрасываю монету один раз и получаю хвосты. Какова вероятность, что это настоящая монета? Очевидно, один. Как проверить теорему Байеса? Что ж, отношение правдоподобия для этого наблюдения - это вероятность увидеть этот результат с реальной монетой по сравнению с поддельной монетой, которая равна 1/2: 0 = 1: 0. То есть, если один хвосты убивает вероятность того, что монета подделка, что подтверждается нашей интуицией.
Вот проблема, о которой я упоминал со страницы Элиэзера:
Перед вами книжный пакет, содержащий 1000 фишек для покера. Я начал с двух таких книжных пакетов, один из которых содержал 700 красных и 300 синих фишек, другой содержал 300 красных и 700 синих. Я подбросил честную монету, чтобы определить, какую книжную сумку использовать, так что ваша предыдущая вероятность того, что красная книжная сумка перед вами - 50%. Теперь вы выбираете случайно, с заменой после каждого чипа. В 12 сэмплах вы получите 8 красных и 4 синих. Какова вероятность того, что это преимущественно красная сумка? (Вам не нужно быть точным - приблизительная оценка достаточно хороша.)
Предыдущие коэффициенты: красный: синий = 1: 1. Коэффициенты вероятности 7: 3 и 3: 7, поэтому задние коэффициенты (7: 3) ^ 8 * (3: 7) ^ 4 = 7 ^ 4: 3 ^ 4. На данный момент мы просто оцениваем 7: 3 как, скажем, 2: 1, и получаем 2 ^ 4: 1 = 16: 1. Наш окончательный ответ еще больше, поэтому он определенно больше 95% или около того; правильный ответ составляет около 96,7%. Сравните это с ответами большинства людей, которые находятся в диапазоне 70--80%.
Надеюсь, вы согласны с тем, что проблемы становятся действительно легкими и интуитивными , если смотреть в этом свете.