интервью о перестановках и комбинациях - PullRequest
19 голосов
/ 15 января 2009

Это хороший вариант, потому что он настолько интуитивен:

Представьте себе урну, наполненную шариками, две трети из которых одного цвета, а одна треть другого. Один человек взял 5 урн из урны и обнаружил, что 4 красных и 1 белый. Другой человек нарисовал 20 шаров и обнаружил, что 12 красных и 8 белых. Кто из этих двух людей должен чувствовать себя более уверенным, что урна содержит две трети красных шаров и одну треть белых шаров, а не наоборот? Какие шансы должен дать каждый человек?

Я знаю правильный ответ, но, возможно, я не совсем понял расчет шансов. Кто-нибудь может объяснить?

Ответы [ 5 ]

17 голосов
/ 15 января 2009

У Элиэзера Юдковского есть (действительно, очень длинное, но хорошее) объяснение теоремы Байеса . Примерно на 70% внизу есть параграф, начинающийся с «Перед вами книжный мешок», который объясняет суть этой проблемы.

Изюминка в том, что все, что имеет значение, - это разница между количеством нарисованных красных и белых шаров. Таким образом, вопреки тому, что говорили другие, вам не нужно делать каких-либо вычислений. (Это делает одно из разумных предположений (а), что шары вытянуты с заменой , или (б) урна имеет лот шаров. Тогда количество шаров не не имеет значения.) Вот аргумент:

Напомним теорему Байеса: P (A | B) = P (B | A) * P (A) / P (B). (Примечание по терминологии: P (A) - это предшествующий , а P (A | B) - задний . B - это какое-то наблюдение, которое вы сделали, и терминология отражает вашу уверенность до и после вашего наблюдения.) С этой формой теоремы все в порядке, и @bobince и @Adam Rosenfield правильно ее применили. Однако использование этой формы напрямую делает вас подверженным арифметическим ошибкам, и в действительности это не передает теорему Байеса сердце . Адам упомянул в своем посте (и я упоминал выше), что все, что имеет значение, это разница между количеством красных и белых шаров, которые были нарисованы, потому что «все остальное в уравнениях сводится на нет». Как мы можем увидеть это без каких-либо расчетов?

Мы можем использовать понятия коэффициент шансов и коэффициент вероятности . Что такое отношение шансов? Ну, вместо того, чтобы думать о P (A) и P (¬A), мы будем думать об их соотношении P (A): P (¬A). Один из них можно восстановить из другого, но арифметика работает лучше с отношениями шансов, потому что нам не нужно нормализовать. Кроме того, легче «получить» теорему Байеса в ее альтернативной форме.

Что я имею в виду, нам не нужно нормализовать, и какова альтернативная форма? Что ж, давайте посчитаем. Теорема Байеса гласит, что задние шансы равны

P (A | B): P (¬A | B) = (P (B | A) * P (A) / P (B)): (P (B | ¬A) * P (¬A ) / P (B)).

P (B) является нормализующим фактором, чтобы сделать вероятности равными единице; однако мы работаем с коэффициентами, где шансы 2: 1 и 4: 2 - это одно и то же, поэтому P (B) отменяется. У нас есть простое выражение, которое происходит с фактором:

P (A | B): P (¬A | B) = (P (B | A) * P (A)): (P (B | ¬A) * P (¬A)) = (P (B | A): P (B | ¬A)) * (P (A): P (¬A))

Мы уже слышали о втором семестре там; это соотношение предыдущих шансов. Что такое P (B | A): P (B | ¬A)? Это называется отношение правдоподобия . Итак, наше окончательное выражение

задние шансы = отношение правдоподобия * предыдущие шансы.

Как мы применим это в этой ситуации? Хорошо, предположим, что у нас есть некоторые предыдущие коэффициенты x: y для содержимого урны, где x представляет 2 / 3rds красного цвета, а y представляет 2/3rds белого цвета. Предположим, мы нарисуем один красный шар. Отношение правдоподобия равно P (красный шарик Дрю | урна 2/3 красного цвета): P (красный шарик Дрю | урна 2/3 белого цвета) = (2/3): (1/3) = 2: 1. Таким образом, задние шансы 2x: y; если бы мы нарисовали белый шар, шансы на победу были бы равны x: 2y. Теперь мы делаем это для каждого шара в последовательности ; если розыгрыши независимы, то мы просто умножаем все коэффициенты. Таким образом, мы получаем, что если мы начнем с отношения шансов x: y и нарисуем r красных шаров и w белых шаров, мы получим окончательное отношение шансов

(x: y) * (2: 1) ^ r * (1: 2) ^ w = (x * 2 ^ r): (y * 2 ^ w) = (x: y) * (2 ^ (rw): 1).

поэтому мывидите, что все, что имеет значение, это разница между r и w. Это также позволяет нам легко решить проблему. Для первого вопроса («кто должен быть более уверенным?») Предыдущие шансы не имеют значения, если они не 1: 0 или 0: 1, и у обоих людей одинаковые приоры. Действительно, если бы их идентичный предшествующий элемент был x: y, апостериор первого человека был бы (2 ^ 3 * x): y, в то время как апостериор второго человека был бы (2 ^ 4 * x): y, так что второй человек более точно.

Кроме того, предположим, что предыдущие шансы были одинаковыми, то есть 1: 1. Тогда апостериор первого человека был бы 8: 1, в то время как шансы второго человека были бы 16: 1. Мы можем легко перевести их в вероятности 8/9 и 16/17, подтверждая другие расчеты.

Смысл в том, что если вы получите жирное уравнение, приведенное выше, тогда эта проблема будет действительно простой . Но , что не менее важно , вы можете быть уверены, что не ошиблись в арифметике, потому что вы должны делать так мало.

Так что это плохой вопрос программирования, но - это хороший тест для жирного уравнения. Просто для практики, давайте применим его еще к двум задачам:

Я случайно выбираю одну из двух монет: честную или поддельную, двуглавую, с вероятностью 50%. Я переворачиваю его три раза, и он поднимается все три раза. Какова вероятность, что это настоящая монета?

Предыдущие шансы действительны: фальшивка = 1: 1, как указано в задаче. Вероятность того, что я видел бы три головы с настоящей монетой, составляет 1/8, но это равняется 1 с поддельной монетой, поэтому отношение правдоподобия составляет 1: 8. Таким образом, задние шансы = предыдущая * вероятность = 1: 8. Таким образом, вероятность, что это настоящая монета, равна 1/9.

Эта проблема также вызывает важное предостережение: для каждого возможного наблюдения существует возможно различное отношение правдоподобия. Это связано с тем, что отношение правдоподобия для B равно P (B | A): P (B | ¬A), которое необязательно связано с отношением правдоподобия для ¬B, которое равно P (¬B | A): P (¬ B | ¬A). К сожалению, во всех приведенных выше примерах они были противоположны друг другу, но здесь это не так.

Действительно, предположим, что я подбрасываю монету один раз и получаю хвосты. Какова вероятность, что это настоящая монета? Очевидно, один. Как проверить теорему Байеса? Что ж, отношение правдоподобия для этого наблюдения - это вероятность увидеть этот результат с реальной монетой по сравнению с поддельной монетой, которая равна 1/2: 0 = 1: 0. То есть, если один хвосты убивает вероятность того, что монета подделка, что подтверждается нашей интуицией.

Вот проблема, о которой я упоминал со страницы Элиэзера:

Перед вами книжный пакет, содержащий 1000 фишек для покера. Я начал с двух таких книжных пакетов, один из которых содержал 700 красных и 300 синих фишек, другой содержал 300 красных и 700 синих. Я подбросил честную монету, чтобы определить, какую книжную сумку использовать, так что ваша предыдущая вероятность того, что красная книжная сумка перед вами - 50%. Теперь вы выбираете случайно, с заменой после каждого чипа. В 12 сэмплах вы получите 8 красных и 4 синих. Какова вероятность того, что это преимущественно красная сумка? (Вам не нужно быть точным - приблизительная оценка достаточно хороша.)

Предыдущие коэффициенты: красный: синий = 1: 1. Коэффициенты вероятности 7: 3 и 3: 7, поэтому задние коэффициенты (7: 3) ^ 8 * (3: 7) ^ 4 = 7 ^ 4: 3 ^ 4. На данный момент мы просто оцениваем 7: 3 как, скажем, 2: 1, и получаем 2 ^ 4: 1 = 16: 1. Наш окончательный ответ еще больше, поэтому он определенно больше 95% или около того; правильный ответ составляет около 96,7%. Сравните это с ответами большинства людей, которые находятся в диапазоне 70--80%.

Надеюсь, вы согласны с тем, что проблемы становятся действительно легкими и интуитивными , если смотреть в этом свете.

13 голосов
/ 15 января 2009

Пусть A - это событие, когда 2/3 шаров красного цвета, а затем ¬ A - это событие, когда 2/3 шаров белого цвета. Пусть B будет событием, когда первый наблюдатель увидит 4 красных шара из 5, и пусть C будет событием, когда второй наблюдатель увидит 12 красных шариков из 20.

Применяя простую комбинаторику, мы получаем, что

  • P ( B | A ) = (5 выберите 4) (2/3) 4 (1/3) 1 = 80/243
  • P ( B | ¬ A ) = (5 выберите 4) (1/3) 4 (2/3) 1 = 10/243

Поэтому, согласно закону Байеса, наблюдатель 1 имеет уровень достоверности 80 / (80 + 10) = 8/9, что A верно.

Для второго наблюдателя:

  • P ( C | A ) = (20 выберите 12) (2/3) 12 (1/3) 8 = 125970 * 2 12 / 3 20
  • P ( C | ¬ A ) = (20 выберите 12) (1/3) 12 (2/3) 8 = 125970 * 2 8 / 3 20

Итак, опять же из закона Байеса наблюдатель 2 имеет уровень достоверности 2 12 / (2 12 + 2 8 ) = 16/17, что A верно.

Следовательно, наблюдатель два имеет более высокий уровень достоверности, чем 2/3 шаров красного цвета. Ключ должен понять, как работает закон Байеса. Фактически, все, что имеет значение, - это разница в количестве наблюдаемых красных и белых шаров. Все остальное (в частности, общее количество выпавших шаров) в уравнениях сводится на нет.

3 голосов
/ 15 января 2009

Я предполагаю, что «априорная» вероятность одной гипотезы по сравнению с другой равна 1/2, и более того, что оба индивида заново вставляют каждый шарик после извлечения его (извлечения не зависят друг от друга).

Правильный ответ таков: второй наблюдатель должен быть более уверенным, чем первый. Мой предыдущий ответ был неверным из-за тривиальной ошибки в вычислениях, большое спасибо и +1 Адаму Розенфилду за его исправление.

Пусть 2 / 3R 1 / 3W обозначает событие «урна содержит 2/3 красных и 1/3 белых шаров», а 4R, 1W обозначает мероприятие «4 красных шара и 1 белый шар извлекаются». Затем, используя правило Байеса,

P [ 2 / 3R 1 / 3W | 4R, 1W ] = P [ 4R, 1W | 2 / 3R 1 / 3W ] P [ 2 / 3R 1 / 3W ] / P [ 4R, 1W ] = (2/3) 4 (1/3) 1 (1/2) / P [ 4R, 1W ]

Теперь, поскольку 2 / 3R 1 / 3W и 1 / 3R 2 / 3W дополняют друг друга по гипотезе,

P [ 4R, 1 Вт ] = P [ 4R, 1 Вт | 2 / 3R 1 / 3W ] P [ 2 / 3R 1 / 3W ] + P [ 4R, 1W | 1 / 3R 2 / 3W ] P [ 1 / 3R 2 / 3W ] = (2/3) 4 (1/3) 1 (1/2) + (1/3) 4 (2/3) 1 (1/2)

Таким образом,

P [ 2 / 3R 1 / 3W | 4R, 1W ] = (2/3) 4 (1/3) 1 (1/2) / {(2/3) 4 (1/3) 1 (1/2) + (1/3) 4 (2/3) 1 (1/2)} = 2 ^ 4 / (2 ^ 4 + 2) = 8/9

Тот же расчет для P [ 2 / 3R 1 / 3W | 12R, 8 Вт ] (т.е. имея (2/3) 12 (1/3) 8 вместо (2/3) 4 (1/3) 1 ) дает теперь 16/17 , следовательно, доверие второго наблюдателя больше, чем первого.

2 голосов
/ 15 января 2009

P [2 / 3R 1 / 3W | 4R, 1 Вт] = (2/3) ^ 4 * (1/3) ^ 1 * (1/2) / {(2/3) ^ 4 * (1/3) ^ 1 * (1/2) + (1/3) ^ 4 * (2/3) ^ 1 * (1/2)} = 2 ^ 4 / (2 ^ 4 + 1) = 16/17

эр,

= ⅔^4*⅓ / (⅔^4*⅓ + ⅓^4*⅔)
= 16/243 / (16/243 + 2/243)
= 16/18

P (⅔R⅓W | 12R8W) действительно, однако, = 16/17, поэтому 12R8W может быть более уверенным.

0 голосов
/ 18 августа 2011

Хех. Может быть, я совершенно не прав, но разве не интуитивно понятно, что ответом должен быть второй парень?

Видно соотношение: 4: 1 4/5: 1/5

Двое видят соотношение 3: 1 3/4: 1/4

Итак, простой вопрос: кто ближе к 2/3: 1/3? Следовательно, ответ Obs. Два.

Может быть, я сделал две ошибки и получаю простой ответ на что-то сложное, но простите мое терпение, чтобы пройти длинное объяснение того, что я на самом деле считал интуитивным.

...