Python statsmodels: регрессионная сводка, как получить p-значение для контрольной фиктивной переменной? - PullRequest
0 голосов
/ 22 октября 2018

Я использую MNLogit (полиномиальная логистическая регрессия) следующим образом:

from statsmodels.formula.api import MNLogit
model=MNLogit.from_formula("y ~ x", df).fit()
model.summary()

Переменная y является категориальной и кажется автоматически фиктивной, закодированной функцией MNLogit.В итоговом выводе дается строка для каждой категории y, кроме ссылочной категории.

1) Как получить идентификатор ссылочной категории?(Это утомительно, чтобы выяснить это вручную из-за множества категорий для y)

2) Поскольку нет z или P> | z |(p-значение), данное для ссылочной категории, как я могу оценить значимость для ссылочной категории?

3) Как я могу изменить, какая категория рассматривается как ссылочная категория?

Ответы [ 2 ]

0 голосов
/ 25 октября 2018
  1. Я считаю, что с statmodels MNLogit 1-ая переменная в отсортированном строкой списке ваших возможных переменных y всегда используется в качестве референта.Вы можете проверить первую переменную, используя model.model._ynames_map в вашем примере.Это вернет словарь, и значение с ключом 0 должно быть тем, которое используется для референта.

  2. Этот сайт предоставляет некоторую информацию о том, как интерпретироватьреферент.Я не буду заимствовать смысл, перепечатывая это.Это не в python, но клиенты статистики хранятся в разных языках.

  3. В качестве первого отсортированного ответа служит референтом, я полагаю, вам придется изменить ответ на то, что вы хотелидобавьте «AAAAA» или что-то похожее на ответ, чтобы убедиться, что он появляется первым в списке, но это не нужно, если вы сможете узнать, какой из них является референтом, и при необходимости скорректировать формулировку своих выводов.

0 голосов
/ 22 октября 2018
  1. . Добавьте вашу категориальную переменную, при желании вы можете использовать различные методы контрастности, чтобы установить, какой тип контрастов вы хотите.
...