Stats Model - Незначительные особенности преобразования - PullRequest
1 голос
/ 04 апреля 2020

Я работаю над базой данных UCI Parkinson https://archive.ics.uci.edu/ml/machine-learning-databases/parkinsons/ Когда я запускаю регрессию logisti c с использованием модели статистики, все функции оказываются незначительными, требуются предложения по их преобразованию.

logit = sm.Logit(y, X_std) result = logit.fit() print(result.summary()) logit output

Точность модели высокая на 85%, но это не имеет смысла, так как все функции незначительны.

Пожалуйста, помогите

1 Ответ

0 голосов
/ 04 апреля 2020

Ваш размер выборки недостаточно велик, чтобы надежно оценить столько параметров. Если существует корреляция между объясняющими переменными, то они могут быть индивидуально статистически незначимыми, даже если они совместно обладают предсказательной силой.

При таком количестве переменных лучше использовать штрафную оценку или использовать какой-либо метод для выбора признаков, чтобы уменьшить количество параметров и получить более достоверные оценки.

...