Какой тип теста в R я должен выполнить, чтобы сравнить фактор с числом, а затем фактор с фактором? - PullRequest
0 голосов
/ 13 марта 2020

У меня есть коэффициент значений «Хорошо» и «Плохо» в первом столбце для обоих приведенных ниже данных.

  • У меня есть один кадр данных, содержащий столбцы из 20 различных чисел ,

  • У меня есть второй фрейм данных, который содержит столбцы с 9 различными факторами.

Я хотел бы сделать тип теста Я могу сказать, какие цифры и факторы (с точностью до 95%) точно предсказывают, является ли фактор «хорошим» или «плохим» в перечисленных выше фреймах данных.

Я начал с выяснения, как использовать lapply для создания функция для сравнения первого столбца с числовыми значениями следующим образом:

tests <- lapply(1:22, function(x) t.test(df[,x] ~ df[,23]))

Работает, но большинство значений p:

значение p <2.2e-16 </p>

Так что я чувствую, что здесь делаю что-то не так.

Что касается второго, когда я сравниваю два фактора друг с другом, я немного растерялся. Я получил несколько советов использовать chisq.test, чтобы сравнить их, например:

chisq.test(statusGoodBad, state)

Однако, у этого также есть низкое значение p, такое как:

p -значение = 7.462e-16

, а также выдает предупреждение:

Аппроксимация хи-квадрат может быть неправильной

...