Проблема вероятности - дублирует при выборе из большой корзины - PullRequest
2 голосов
/ 26 сентября 2008

Мне нужно объяснить клиенту, почему дуплисы появляются между 2 предположительно разными экзаменами. Прошло 20 лет с тех пор, как Проб и Статистика.

У меня сгенерированный экзамен с несколькими вариантами ответов. В базе 192 вопроса, 100 выбираются случайным образом (без дупликов).

Очевидно, есть 100% шанс, что между любыми двумя сгенерированными экзаменами будет как минимум 8 дупликов. (Принцип голубя)

Как рассчитать вероятность существования 25 парочек? 50 дупсов? 75 дупсов?

- Редактировать по факту - Я проверил это через Excel, взяв суммы вероятностей из n-100, Для этой конкретной проблемы вероятности были

n   P(n+ dupes)
40  97.5%
52  ~50% 
61  ~0

Ответы [ 3 ]

2 голосов
/ 26 сентября 2008

Хм, это действительно очень туманно для меня. Но есть (192 выбрать 100) возможных экзаменов, верно?

И есть (100 на выбор N) способов выбора N дупсов, каждый с (92 на выбор 100-N) способов выбора остальных вопросов, нет?

Так что вероятность выбора N парней не просто:

(100 выбирают N) * (92 выбирают 100-N) / (192 выбирают 100)

РЕДАКТИРОВАТЬ: Таким образом, если вы хотите, чтобы шансы N или более дупликов вместо ровно N, вы должны суммировать верхнюю половину этой дроби для всех значений N от минимального количества дупликов до 100.

Errrr, может быть ...

1 голос
/ 26 сентября 2008

Как только вы создали первый экзамен, есть 92 вопроса, которые никогда не использовались, и 100, которые никогда не использовались. Если вы сейчас создадите еще один экзамен, содержащий 100 вопросов, вы выбираете из набора 92 вопросов, которые никогда не использовались, и 100 вопросов, которые уже были. Очевидно, вы получите довольно много дубликатов.

Вы ожидаете получить (100/192) * 100 дубликатов, то есть в любых двух случайно выбранных экзаменах будет (в среднем) 52 дублирующих вопроса.

Если вы хотите, чтобы вероятность была 25, или 75, или что-то еще, тогда у вас есть два варианта.

а) Отработать математику

б) Имитация нескольких прогонов на компьютере

0 голосов
/ 26 сентября 2008

Это, вероятно, выше, чем вы думаете. Я не буду пытаться дублировать эту статью: http://en.wikipedia.org/wiki/Birthday_paradox

...