Даст ли подобная линейная регрессия и выполнение t-теста аналогичные результаты? - PullRequest
0 голосов
/ 21 мая 2019

Я пытаюсь предсказать статистически значимые переменные из списка двоичных переменных.У меня есть концептуальное сомнение в следующих двух подходах, чтобы найти соответствующие переменные.

Зависимая переменная: Рост человека

Независимые переменные:

  1. Пол (мужской или женский)
  2. Financial_Status (ниже черты бедности или нет)
  3. College_Graduate (да или нет)

подход 1: Подгонка линейной регрессии при принятии этихв качестве зависимых / независимых переменных и нахождения статистически значимых переменных

Подход 2: Выполнение отдельного статистического теста для каждой зависимой переменной (t-критерий или какой-либо другой соответствующий критерий) для вычисления статистически значимого значенияпеременные

Являются ли оба эти подхода одинаковыми и дадут ли сходные результаты?Если нет, то какая разница?

1 Ответ

0 голосов
/ 22 мая 2019

Так как у вас есть несколько независимых переменных, то явно нет.

Если вы хотите использовать метод ttest для каждого из значений различных независимых переменных (Gender, Financial_Status и College_Graduate), это означает, чтоВы будете выполнять 3 разных теста.Выполнение нескольких тестов является чем-то рискованным с точки зрения ложноположительных результатов, и поэтому его следует скорректировать с помощью метода корректировки множественного сравнения (Bonferoni, FDR, среди прочих).

С другой стороны, если вы будетеиспользуйте одну многофакторную линейную регрессию, которую вы бы не использовали для множественных сравнений, поэтому, на мой взгляд, это лучший подход.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...