Добавить десятичную к вычислению P-значения - PullRequest
0 голосов
/ 24 августа 2018

У меня есть набор данных, по которому я вычисляю критерий Chi² для каждой пары столбцов, чтобы определить, коррелированы ли 2 столбца (с номинальными данными).

Из моего понимания Chi², если значение P меньше 5% (0,05), тогда 2 столбца связаны между собой.Я использую функцию scipy.stats.chi2_contingency.Однако из моего набора данных из моих вычислений видно, что P-значение всегда равно 0,0. Я хотел бы знать, как повысить точность p-значения, чтобы получить больше 00 и около запятой.В настоящее время я даже не могу убедиться, что он выше или ниже 5%, или как сам рассчитать значение p.

Я уточнил, что мой набор данных немного специфичен, поскольку его таблица сопряженности содержит много уникальных значений, но большая часть выборки также меньше 5, большую часть времени равна 0.

...