Доля в когортах против общей доли - PullRequest
1 голос
/ 29 января 2020

У меня математическая задача, с которой мне нужна помощь. Это медицинское исследование, но я буду использовать фруктовые сады в качестве примера.

Допустим, исследование, проведенное в фруктовом саду, изучило долю плохих яблок. Исследование показало, что: Результаты исследования

A) Красные яблоки (плохие 10; хорошие 90, поэтому вероятность плохого яблока составляет 0,10)

B) Зеленые яблоки (плохо 20; хорошо 80, вероятность плохого яблока 0,20)

Таким образом

C) Все яблоки - зеленые и красные (плохо 30; хорошо 170, вероятность плохого яблока 0,15)

Теперь, основываясь на этом исследовании, я хочу оценить, сколько плохих яблок можно ожидать в моем саду.

У меня в саду 1000 яблок, 600 красных и 400 зеленых. Может кто-нибудь сказать мне, почему следующие две оценки не совпадают, а также предложить, какая из них верна?

Вариант 1

1000 яблок x вероятность плохого яблока 0,15 = 150 плохих яблок

Вариант 2

600 красных яблок x вероятность плохого красного яблока 0,10 = 60 плохих красных яблок

400 красных яблок x вероятность плохого зеленого яблока 0,20 = 80 плохих зеленых яблок

Что в сумме составляет 60 + 80 = 140 плохих яблок.

Так почему же существует разница и какая оценка верна?

1 Ответ

0 голосов
/ 29 января 2020

Второе правильно. Это верно, потому что оно применяет правильные вероятности к каждому случаю и суммирует результаты; E [X + Y] = E [X] + E [Y]. Первое неверно, потому что оно использует невзвешенное среднее двух вероятностей и применяет его к совокупности, которая не содержит равное количество выборок каждого типа xss. Если бы на ферме было 500 яблок каждого вида, обе процедуры сработали бы.

РЕДАКТИРОВАТЬ: На основе комментариев, уточнение:

Вопрос спрашивает, сколько плохих яблок вы ожидаете. Количество плохих яблок является случайной величиной Z. Количество плохих яблок - это сумма плохих красных и плохих зеленых яблок. Это, в свою очередь, случайные величины X и Y и Z = X + Y. Мы хотим получить ожидаемое значение Z, E [Z], а это E [X + Y]. Из свойств ожидаемого значения мы знаем, что это E [X] + E [Y]. То есть мы можем рассчитать ожидаемое количество плохих красных яблок отдельно от ожидаемого количества плохих зеленых яблок, а затем сложить их вместе, чтобы получить общее количество ожидаемых плохих яблок. Этот метод в основном аналогичен условной вероятности за исключением того, что мы пропустили деление на общее количество яблок; если бы мы это сделали, мы бы использовали условные вероятности, чтобы найти вероятность получить плохое яблоко, что является правильным, но не запрошенным.

...