Расчет вероятности с учетом данных из других столбцов - PullRequest
0 голосов
/ 29 июня 2018

У меня есть текст, который содержит такие данные, как:

ranking index  tornado reports   hail reports   wind reports
0.3968208   9   1   7
0.156263    2   0   3
0.1444246   10  1   7
0.2830781   7   2   6
0.1258707   12  0   2
0.2452705   6   0   6
0.07492937  6   2   8
0.1862151   8   1   5
0.3258324   6   2   17
0.09579834  2   2   10
0.8557362   11  3   14
0.05694438  8   3   9
0.6755703   4   3   24
1.695709    14  0   5
1.242222    17  2   12
0.220234    7   1   7
0.5113825   6   0   6
0.2355718   3   0   12
0.0799512   1   1   6
1.267324    15  2   6
0.0862502   7   1   3
1.151916    33  2   6
0.06002221  9   0   17
0.2011567   11  5   17

Мне нужно найти вероятность того, что вспышка ветра будет основной (индекс ранжирования больше 0,25), учитывая, что количество градов больше 10, количество ветров больше 20 и число торнадо больше 5?

Ответы [ 2 ]

0 голосов
/ 29 июня 2018

Предполагая, что это часть полных данных . Приведенное ниже решение dplyr основано на условиях: hail_reports> 2 & wind_reports> 2 & tornado_reports> 5 (иначе вы получите вероятность ноль для этих данных испытаний). Измените его соответствующим образом для полных данных.

librray(dplyr)

df %>% 
   filter (hail_reports > 2 & wind_reports > 2 & tornado_reports > 5) %>% 
mutate(major = if_else(ranking_index > 0.25, 1, 0)) %>%     # major= 1: index > 0.25
  group_by(major) %>% summarize(n = n()) %>% 
transmute(major, prob = n/sum(n))

#    major  prob
#    <dbl> <dbl>
#  1     0 0.667
#  2     1 0.333                     # major prob = 0.333

PS: Всегда лучше избегать пробелов в именах столбцов. Например, используйте «hail_reports» вместо «отчеты о граде»

0 голосов
/ 29 июня 2018

Я считаю, что это невозможное событие, потому что в данном наборе данных число града никогда не превышает 10. или приведенное выше - это просто образец, а не полный набор?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...