Можете ли вы использовать проверку гипотез для выбора функции? - PullRequest
0 голосов
/ 04 июля 2019

Как вы применяете проверку гипотез к своим функциям в модели ML?Скажем, например, что я выполняю задачу регрессии и хочу сократить некоторые функции (после того, как я обучу свою модель), чтобы повысить производительность.Как применить проверку гипотез, чтобы решить, полезна ли эта функция или нет?Я просто немного озадачен тем, какой будет моя нулевая гипотеза, уровень значимости и как провести эксперимент, чтобы получить p-значение характеристики (я слышал, что уровень значимости 0,15 является хорошим порогом, но яне уверен).

Например.Я делаю регрессионную задачу, чтобы предсказать стоимость моей фабрики, учитывая производство трех машин (A, B, C).Я делаю линейную регрессию с данными и обнаруживаю, что p-значения машины A превышают мой уровень значимости, следовательно, они не являются статистически значимыми, и я решил отказаться от этой функции для моей модели.

Я взял этот пример из видео на Youtube.Я поставил ссылку ниже.

Соответствующий бит начинается с мин 4:00 до 7:00 https://www.youtube.com/watch?v=HgfHefwK7VQ

Я пытался прочитать об этом, но я не смог понятькак он решил этот уровень значимости и как он применил проверку гипотез в этом случае.

Данные выглядят примерно так:

d = ('Cost': [44439, 43936, 44464, 41533, 46343], 
         'A': [515, 929, 800, 979, 1165], 
         'B': [541, 710, 675, 1147, 939], 
         'C': [928, 711, 824, 758, 635, 901])

    df = pd.DataFrame(data=d)

После того, как модель была подобрана, весы следующие::

Вес смещения: 35102, машина A: 2,066, машина B: 4,17, машина C: 4,79

Теперь проблема в том, что значение p для машины A = 0,23, которое былосчитается слишком высоким и, следовательно, эта функция была исключена из прогнозной модели

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...