Question

Это хороший вариант, потому что он настолько интуитивен:

Представьте себе урну, наполненную шариками, две трети из которых одного цвета, а одна треть другого. Один человек взял 5 урн из урны и обнаружил, что 4 красных и 1 белый. Другой человек нарисовал 20 шаров и обнаружил, что 12 красных и 8 белых. Кто из этих двух людей должен чувствовать себя более уверенным, что урна содержит две трети красных шаров и одну треть белых шаров, а не наоборот? Какие шансы должен дать каждый человек?

Я знаю правильный ответ, но, возможно, я не совсем понял расчет шансов. Кто-нибудь может объяснить?

A. Rex · Answer 1 · 15 января 2009

У Элиэзера Юдковского есть (действительно, очень длинное, но хорошее) объяснение теоремы Байеса . Примерно на 70% внизу есть параграф, начинающийся с «Перед вами книжный мешок», который объясняет суть этой проблемы.

Изюминка в том, что все, что имеет значение, - это разница между количеством нарисованных красных и белых шаров. Таким образом, вопреки тому, что говорили другие, вам не нужно делать каких-либо вычислений. (Это делает одно из разумных предположений (а), что шары вытянуты с заменой , или (б) урна имеет лот шаров. Тогда количество шаров не не имеет значения.) Вот аргумент:

Напомним теорему Байеса: P (A | B) = P (B | A) * P (A) / P (B). (Примечание по терминологии: P (A) - это предшествующий , а P (A | B) - задний . B - это какое-то наблюдение, которое вы сделали, и терминология отражает вашу уверенность до и после вашего наблюдения.) С этой формой теоремы все в порядке, и @bobince и @Adam Rosenfield правильно ее применили. Однако использование этой формы напрямую делает вас подверженным арифметическим ошибкам, и в действительности это не передает теорему Байеса сердце . Адам упомянул в своем посте (и я упоминал выше), что все, что имеет значение, это разница между количеством красных и белых шаров, которые были нарисованы, потому что «все остальное в уравнениях сводится на нет». Как мы можем увидеть это без каких-либо расчетов?

Мы можем использовать понятия коэффициент шансов и коэффициент вероятности . Что такое отношение шансов? Ну, вместо того, чтобы думать о P (A) и P (¬A), мы будем думать об их соотношении P (A): P (¬A). Один из них можно восстановить из другого, но арифметика работает лучше с отношениями шансов, потому что нам не нужно нормализовать. Кроме того, легче «получить» теорему Байеса в ее альтернативной форме.

Что я имею в виду, нам не нужно нормализовать, и какова альтернативная форма? Что ж, давайте посчитаем. Теорема Байеса гласит, что задние шансы равны

P (A | B): P (¬A | B) = (P (B | A) * P (A) / P (B)): (P (B | ¬A) * P (¬A ) / P (B)).

P (B) является нормализующим фактором, чтобы сделать вероятности равными единице; однако мы работаем с коэффициентами, где шансы 2: 1 и 4: 2 - это одно и то же, поэтому P (B) отменяется. У нас есть простое выражение, которое происходит с фактором:

P (A | B): P (¬A | B) = (P (B | A) * P (A)): (P (B | ¬A) * P (¬A)) = (P (B | A): P (B | ¬A)) * (P (A): P (¬A))

Мы уже слышали о втором семестре там; это соотношение предыдущих шансов. Что такое P (B | A): P (B | ¬A)? Это называется отношение правдоподобия . Итак, наше окончательное выражение

задние шансы = отношение правдоподобия * предыдущие шансы.

Как мы применим это в этой ситуации? Хорошо, предположим, что у нас есть некоторые предыдущие коэффициенты x: y для содержимого урны, где x представляет 2 / 3rds красного цвета, а y представляет 2/3rds белого цвета. Предположим, мы нарисуем один красный шар. Отношение правдоподобия равно P (красный шарик Дрю | урна 2/3 красного цвета): P (красный шарик Дрю | урна 2/3 белого цвета) = (2/3): (1/3) = 2: 1. Таким образом, задние шансы 2x: y; если бы мы нарисовали белый шар, шансы на победу были бы равны x: 2y. Теперь мы делаем это для каждого шара в последовательности ; если розыгрыши независимы, то мы просто умножаем все коэффициенты. Таким образом, мы получаем, что если мы начнем с отношения шансов x: y и нарисуем r красных шаров и w белых шаров, мы получим окончательное отношение шансов

(x: y) * (2: 1) ^ r * (1: 2) ^ w = (x * 2 ^ r): (y * 2 ^ w) = (x: y) * (2 ^ (rw): 1).

поэтому мывидите, что все, что имеет значение, это разница между r и w. Это также позволяет нам легко решить проблему. Для первого вопроса («кто должен быть более уверенным?») Предыдущие шансы не имеют значения, если они не 1: 0 или 0: 1, и у обоих людей одинаковые приоры. Действительно, если бы их идентичный предшествующий элемент был x: y, апостериор первого человека был бы (2 ^ 3 * x): y, в то время как апостериор второго человека был бы (2 ^ 4 * x): y, так что второй человек более точно.

Кроме того, предположим, что предыдущие шансы были одинаковыми, то есть 1: 1. Тогда апостериор первого человека был бы 8: 1, в то время как шансы второго человека были бы 16: 1. Мы можем легко перевести их в вероятности 8/9 и 16/17, подтверждая другие расчеты.

Смысл в том, что если вы получите жирное уравнение, приведенное выше, тогда эта проблема будет действительно простой . Но , что не менее важно , вы можете быть уверены, что не ошиблись в арифметике, потому что вы должны делать так мало.

Так что это плохой вопрос программирования, но - это хороший тест для жирного уравнения. Просто для практики, давайте применим его еще к двум задачам:

Я случайно выбираю одну из двух монет: честную или поддельную, двуглавую, с вероятностью 50%. Я переворачиваю его три раза, и он поднимается все три раза. Какова вероятность, что это настоящая монета?

Предыдущие шансы действительны: фальшивка = 1: 1, как указано в задаче. Вероятность того, что я видел бы три головы с настоящей монетой, составляет 1/8, но это равняется 1 с поддельной монетой, поэтому отношение правдоподобия составляет 1: 8. Таким образом, задние шансы = предыдущая * вероятность = 1: 8. Таким образом, вероятность, что это настоящая монета, равна 1/9.

Эта проблема также вызывает важное предостережение: для каждого возможного наблюдения существует возможно различное отношение правдоподобия. Это связано с тем, что отношение правдоподобия для B равно P (B | A): P (B | ¬A), которое необязательно связано с отношением правдоподобия для ¬B, которое равно P (¬B | A): P (¬ B | ¬A). К сожалению, во всех приведенных выше примерах они были противоположны друг другу, но здесь это не так.

Действительно, предположим, что я подбрасываю монету один раз и получаю хвосты. Какова вероятность, что это настоящая монета? Очевидно, один. Как проверить теорему Байеса? Что ж, отношение правдоподобия для этого наблюдения - это вероятность увидеть этот результат с реальной монетой по сравнению с поддельной монетой, которая равна 1/2: 0 = 1: 0. То есть, если один хвосты убивает вероятность того, что монета подделка, что подтверждается нашей интуицией.

Вот проблема, о которой я упоминал со страницы Элиэзера:

Перед вами книжный пакет, содержащий 1000 фишек для покера. Я начал с двух таких книжных пакетов, один из которых содержал 700 красных и 300 синих фишек, другой содержал 300 красных и 700 синих. Я подбросил честную монету, чтобы определить, какую книжную сумку использовать, так что ваша предыдущая вероятность того, что красная книжная сумка перед вами - 50%. Теперь вы выбираете случайно, с заменой после каждого чипа. В 12 сэмплах вы получите 8 красных и 4 синих. Какова вероятность того, что это преимущественно красная сумка? (Вам не нужно быть точным - приблизительная оценка достаточно хороша.)

Предыдущие коэффициенты: красный: синий = 1: 1. Коэффициенты вероятности 7: 3 и 3: 7, поэтому задние коэффициенты (7: 3) ^ 8 * (3: 7) ^ 4 = 7 ^ 4: 3 ^ 4. На данный момент мы просто оцениваем 7: 3 как, скажем, 2: 1, и получаем 2 ^ 4: 1 = 16: 1. Наш окончательный ответ еще больше, поэтому он определенно больше 95% или около того; правильный ответ составляет около 96,7%. Сравните это с ответами большинства людей, которые находятся в диапазоне 70--80%.

Надеюсь, вы согласны с тем, что проблемы становятся действительно легкими и интуитивными , если смотреть в этом свете.

Adam Rosenfield · Answer 2 · 15 января 2009

Пусть A - это событие, когда 2/3 шаров красного цвета, а затем ¬ A - это событие, когда 2/3 шаров белого цвета. Пусть B будет событием, когда первый наблюдатель увидит 4 красных шара из 5, и пусть C будет событием, когда второй наблюдатель увидит 12 красных шариков из 20.

Применяя простую комбинаторику, мы получаем, что

P ( B | A ) = (5 выберите 4) (2/3) ⁴ (1/3) ¹ = 80/243
P ( B | ¬ A ) = (5 выберите 4) (1/3) ⁴ (2/3) ¹ = 10/243

Поэтому, согласно закону Байеса, наблюдатель 1 имеет уровень достоверности 80 / (80 + 10) = 8/9, что A верно.

Для второго наблюдателя:

P ( C | A ) = (20 выберите 12) (2/3) ¹² (1/3) ⁸ = 125970 * 2 ¹² / 3 ²⁰
P ( C | ¬ A ) = (20 выберите 12) (1/3) ¹² (2/3) ⁸ = 125970 * 2 ⁸ / 3 ²⁰

Итак, опять же из закона Байеса наблюдатель 2 имеет уровень достоверности 2 ¹² / (2 ¹² + 2 ⁸) = 16/17, что A верно.

Следовательно, наблюдатель два имеет более высокий уровень достоверности, чем 2/3 шаров красного цвета. Ключ должен понять, как работает закон Байеса. Фактически, все, что имеет значение, - это разница в количестве наблюдаемых красных и белых шаров. Все остальное (в частности, общее количество выпавших шаров) в уравнениях сводится на нет.

Federico A. Ramponi · Answer 3 · 15 января 2009

Я предполагаю, что «априорная» вероятность одной гипотезы по сравнению с другой равна 1/2, и более того, что оба индивида заново вставляют каждый шарик после извлечения его (извлечения не зависят друг от друга).

Правильный ответ таков: второй наблюдатель должен быть более уверенным, чем первый. Мой предыдущий ответ был неверным из-за тривиальной ошибки в вычислениях, большое спасибо и +1 Адаму Розенфилду за его исправление.

Пусть 2 / 3R 1 / 3W обозначает событие «урна содержит 2/3 красных и 1/3 белых шаров», а 4R, 1W обозначает мероприятие «4 красных шара и 1 белый шар извлекаются». Затем, используя правило Байеса,

P [ 2 / 3R 1 / 3W | 4R, 1W ] = P [ 4R, 1W | 2 / 3R 1 / 3W ] P [ 2 / 3R 1 / 3W ] / P [ 4R, 1W ] = (2/3) ⁴ (1/3) ¹ (1/2) / P [ 4R, 1W ]

Теперь, поскольку 2 / 3R 1 / 3W и 1 / 3R 2 / 3W дополняют друг друга по гипотезе,

P [ 4R, 1 Вт ] = P [ 4R, 1 Вт | 2 / 3R 1 / 3W ] P [ 2 / 3R 1 / 3W ] + P [ 4R, 1W | 1 / 3R 2 / 3W ] P [ 1 / 3R 2 / 3W ] = (2/3) ⁴ (1/3) ¹ (1/2) + (1/3) ⁴ (2/3) ¹ (1/2)

Таким образом,

P [ 2 / 3R 1 / 3W | 4R, 1W ] = (2/3) ⁴ (1/3) ¹ (1/2) / {(2/3) ⁴ (1/3) ¹ (1/2) + (1/3) ⁴ (2/3) ¹ (1/2)} = 2 ^ 4 / (2 ^ 4 + 2) = 8/9

Тот же расчет для P [ 2 / 3R 1 / 3W | 12R, 8 Вт ] (т.е. имея (2/3) ¹² (1/3) ⁸ вместо (2/3) ⁴ (1/3) ¹) дает теперь 16/17 , следовательно, доверие второго наблюдателя больше, чем первого.

bobince · Answer 4 · 15 января 2009

P [2 / 3R 1 / 3W | 4R, 1 Вт] = (2/3) ^ 4 * (1/3) ^ 1 * (1/2) / {(2/3) ^ 4 * (1/3) ^ 1 * (1/2) + (1/3) ^ 4 * (2/3) ^ 1 * (1/2)} = 2 ^ 4 / (2 ^ 4 + 1) = 16/17

эр,

= ⅔^4*⅓ / (⅔^4*⅓ + ⅓^4*⅔)
= 16/243 / (16/243 + 2/243)
= 16/18

P (⅔R⅓W | 12R8W) действительно, однако, = 16/17, поэтому 12R8W может быть более уверенным.

Ajeet Ganga · Answer 5 · 18 августа 2011

Хех. Может быть, я совершенно не прав, но разве не интуитивно понятно, что ответом должен быть второй парень?

Видно соотношение: 4: 1 4/5: 1/5

Двое видят соотношение 3: 1 3/4: 1/4

Итак, простой вопрос: кто ближе к 2/3: 1/3? Следовательно, ответ Obs. Два.

Может быть, я сделал две ошибки и получаю простой ответ на что-то сложное, но простите мое терпение, чтобы пройти длинное объяснение того, что я на самом деле считал интуитивным.

интервью о перестановках и комбинациях

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 5 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

интервью о перестановках и комбинациях

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 5 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы