Проверка пригодности по критерию хи-квадрат не дает графика, соответствующего распределению хи-квадрат - PullRequest
0 голосов
/ 22 октября 2018

Я пытаюсь смоделировать вопрос жюри из раздела 6.3.1 из Открытого вступления в Статистику 3E, но моё моделирование кажется неправильным.Пожалуйста, см. Ниже.

Мой код для моделирования:

white_proba = 0.72
black_proba = 0.07
hispanic_proba = 0.12
other_proba = 0.09
sample = 275
_sum = 275
n = 4

array_of_proba = np.array([white_proba, black_proba, hispanic_proba, other_proba])

number_of_simulations = 1000
master_list_of_chi_stat = []
master_list_of_chi_p_value = []
for b in range(number_of_simulations):
    observed_values = np.random.multinomial(_sum, np.ones(n)/n, size=1)[0]
    expected_values = array_of_proba * sample
    chi_square_stats = np.sum(np.square((observed_values - expected_values)/np.sqrt(expected_values)))
    master_list_of_chi_stat.append(chi_square_stats)

Мой код для графика:

# Add histogram data
x2 = master_list_of_chi_stat

# Group data together
hist_data = [x2]

group_labels = ['Chi_Square_Stat']

# Create distplot with custom bin_size
fig = ff.create_distplot(hist_data, group_labels, bin_size=0.1)

# Plot!
py.iplot(fig, filename='Chi_Square_Stat')

Очевидно, что-то не так с моим кодом.Заранее спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...