Подсчет данных в Excel для расчета вероятностей пересечений - PullRequest
0 голосов
/ 12 мая 2019

У меня есть следующая проблема, и я надеюсь, что кто-то может дать мне подсказку: у меня есть лист Excel с тремя столбцами. В первом столбце у меня есть код страны, во втором столбце у меня есть код сектора (~ 50 кодов секторов на страну и более 30 стран). Третий столбец включает в себя 0/1-манекен. Я хотел бы знать вероятность того, что Пустышка одна для сектора 1 И сектора 2 (пересечение). Для этого мне нужно знать, как часто 1 встречается в секторе 1 и в секторе 2.

Окончательный результат должен быть условной вероятностью, и я думаю, что вычисление его по хорошо известной формуле P (A | B) = P (пересечение A и B) / P (B) является самым простым способом - однако, если есть Я бы очень признателен за более простые способы вычисления условной вероятности.

В упрощенном варианте проблема выглядит следующим образом, где я хотел бы знать вероятность того, что AND b равны 1:

скриншот упрощенной таблицы

Заранее спасибо!

1 Ответ

0 голосов
/ 12 мая 2019

Просто для начала, я предлагаю вам сначала повернуть данные, а затем разделить число строк с a = 1 и b = 1 на количество строк (стран) в таблице, используя

=COUNTIFS(G3:G5,1,H3:H5,1)/COUNT(G3:G5)

enter image description here

...