критерий хи-квадрат для логарифмических отношений правдоподобия для проверки вложенных гипотез на 4 моделях линейной регрессии - PullRequest
0 голосов
/ 20 сентября 2019

Я новичок в этом материале

Я пытаюсь восстановить процедуру из статьи, которую я прочитал.Сначала мне пришлось построить 4 модели для моих необработанных данных (точки X и Y) - одна модель постоянна, вторая - линейна, третья - постоянна, а затем в X_0 линейная и четвертая - кусочно-линейная регрессия, а затем в X_0 другие линейныерегрессия с другим наклоном.

Я использовал sklearn.linear_model для импорта LinearRegression для построения деталей, которые являются линейными в моделях.

Второй этап - выбор модели, и в этой части Iнам трудно понять, что делать в соответствии со статьей:

Мы проверили соответствие предсказаний модели нашим данным, допуская аддитивную ошибку Гаусса (с нулевым средним и подобранной дисперсией максимального правдоподобия) иполученные значения p с помощью критерия хи-квадрат для логарифмических отношений правдоподобия для проверки вложенных гипотез.Мы назначили более сложную модель только тем репортерам, которые уверенно (p <0,01) отклонили более простую модель с меньшими параметрами. </p>

Я видел, что, учитывая логарифмические вероятности моделей, я могу получить P-Значение с использованием хи-квадрат, как показано здесь: Проверка отношения правдоподобия в Python

Моя проблема заключается в том, чтобы понять, как по данной модели я могу рассчитать логарифмическое правдоподобие (с или без их предположения оаддитивная ошибка Гаусса)?

Я искал по всему Интернету, и то, что я нахожу в этом вопросе, использует максимальную вероятность для нахождения линейной регрессии, но, насколько я понимаю, эта часть, возможно, связана с первойэтап поиска моделей, но не для второго этапа, который должен выбрать один.

...