Есть несколько вопросов, которые я нашел по этой теме, но ни один не вполне аналогичен моему сценарию.Это в первую очередь вопрос общего подхода к статистике, но любая полезная информация о том, как подходить к данным такого типа в R, высоко ценится!
Это биологическое исследование, в котором у меня есть три независимых мутации: «A, B,и C, «который я использую для создания генотипов.Для моего проекта исследования у меня есть зависимая переменная (расстояние) и независимая переменная (нагрузка).который я измеряю в следующих генотипах:
Genotypes:
Reference
A
B
C
A:B
A:C
B:C
A:B:C
т.е. у меня есть фоновые уровни Дистанции, заданной Нагрузкой в моем Базовом генотипе.То, что я хочу проверить, - это вклад каждой отдельной мутации (A, B или C) и комбинированных мутаций (AB, AC, BC, ABC) в расстояние для данной нагрузки.Мой план для этого состоял в том, чтобы проверить, были ли наклоны регрессий, вызванных различными генотипами, значительно отличались друг от друга.Это позволило бы мне определить, является ли потеря в расстоянии из-за аддитивного увеличения нагрузки, или если определенные генотипы теряют расстояние быстрее или медленнее при увеличении нагрузки.
Я не уверен, смогу ли я использовать ANCOVA или каксмешанная модель эффектов для этого вопроса.
У меня похожий подход, когда я вижу, как расстояние зависит от генотипа.В этом примере моя структура данных выглядит следующим образом (csv):
Genotype, Distance, A, B, C
Reference, 15, 0, 0, 0
Reference, 16, 0, 0, 0
A, 15, 1, 0, 0
A, 16, 1, 0, 0
B, 12, 0, 1, 0
B, 11, 0, 1, 0
C, 15, 0, 0, 1
C, 15, 0, 0, 1
AB, 3, 1, 1, 0
AB, 4, 1, 1, 0
AC, 13, 1, 0, 1
AC, 14, 1, 0, 1
BC, 8, 0, 1, 1
BC, 9, 0, 1, 1
ABC, 2, 1, 1, 1
ABC, 2, 1, 1, 1
Где я измеряю расстояние для каждого генотипа (с репликами) и использую матрицу данных, чтобы указать, какие мутации у этого генотипа:имеет 1, 0, 0, чтобы указать, что имеет A, но не B и не C;AB имеет 1, 1, 0, чтобы указать, что у него есть A и B, но не C. и т.д. ...
И затем я использую:
lm<-lm(Distance~A*B*C, data=data)
summary(lm)
, чтобы проверить вклад каждой мутацииРасстояние и посмотреть, являются ли какие-либо условия взаимодействия (например, A: B) значительными.При этом в качестве непрерывных переменных используются A, B и C (нарушение нормальности, но, по крайней мере, это подход).
С благодарностью за любую помощь, понимание или указания, на которые может указывать каждый.Применение этого подхода lm () работает с одной зависимой переменной и генотипами в качестве независимой переменной, но использование генотипов (включая взаимодействия) в качестве ковариат для второй независимой переменной - это то, чего я не видел в других вопросах.