У меня есть коэффициент значений «Хорошо» и «Плохо» в первом столбце для обоих приведенных ниже данных.
У меня есть один кадр данных, содержащий столбцы из 20 различных чисел ,
У меня есть второй фрейм данных, который содержит столбцы с 9 различными факторами.
Я хотел бы сделать тип теста Я могу сказать, какие цифры и факторы (с точностью до 95%) точно предсказывают, является ли фактор «хорошим» или «плохим» в перечисленных выше фреймах данных.
Я начал с выяснения, как использовать lapply для создания функция для сравнения первого столбца с числовыми значениями следующим образом:
tests <- lapply(1:22, function(x) t.test(df[,x] ~ df[,23]))
Работает, но большинство значений p:
значение p <2.2e-16 </p>
Так что я чувствую, что здесь делаю что-то не так.
Что касается второго, когда я сравниваю два фактора друг с другом, я немного растерялся. Я получил несколько советов использовать chisq.test, чтобы сравнить их, например:
chisq.test(statusGoodBad, state)
Однако, у этого также есть низкое значение p, такое как:
p -значение = 7.462e-16
, а также выдает предупреждение:
Аппроксимация хи-квадрат может быть неправильной