Сравните наклоны линий регрессии по взаимодействию ковариат - PullRequest
0 голосов
/ 25 мая 2018

Есть несколько вопросов, которые я нашел по этой теме, но ни один не вполне аналогичен моему сценарию.Это в первую очередь вопрос общего подхода к статистике, но любая полезная информация о том, как подходить к данным такого типа в R, высоко ценится!

Это биологическое исследование, в котором у меня есть три независимых мутации: «A, B,и C, «который я использую для создания генотипов.Для моего проекта исследования у меня есть зависимая переменная (расстояние) и независимая переменная (нагрузка).который я измеряю в следующих генотипах:

Genotypes:

Reference
A
B
C
A:B
A:C
B:C
A:B:C

т.е. у меня есть фоновые уровни Дистанции, заданной Нагрузкой в ​​моем Базовом генотипе.То, что я хочу проверить, - это вклад каждой отдельной мутации (A, B или C) и комбинированных мутаций (AB, AC, BC, ABC) в расстояние для данной нагрузки.Мой план для этого состоял в том, чтобы проверить, были ли наклоны регрессий, вызванных различными генотипами, значительно отличались друг от друга.Это позволило бы мне определить, является ли потеря в расстоянии из-за аддитивного увеличения нагрузки, или если определенные генотипы теряют расстояние быстрее или медленнее при увеличении нагрузки.

Я не уверен, смогу ли я использовать ANCOVA или каксмешанная модель эффектов для этого вопроса.

У меня похожий подход, когда я вижу, как расстояние зависит от генотипа.В этом примере моя структура данных выглядит следующим образом (csv):

Genotype, Distance, A, B, C
Reference, 15, 0, 0, 0
Reference, 16, 0, 0, 0
A, 15, 1, 0, 0
A, 16, 1, 0, 0
B, 12, 0, 1, 0
B, 11, 0, 1, 0
C, 15, 0, 0, 1
C, 15, 0, 0, 1
AB, 3, 1, 1, 0
AB, 4, 1, 1, 0
AC, 13, 1, 0, 1
AC, 14, 1, 0, 1
BC, 8, 0, 1, 1
BC, 9, 0, 1, 1
ABC, 2, 1, 1, 1
ABC, 2, 1, 1, 1

Где я измеряю расстояние для каждого генотипа (с репликами) и использую матрицу данных, чтобы указать, какие мутации у этого генотипа:имеет 1, 0, 0, чтобы указать, что имеет A, но не B и не C;AB имеет 1, 1, 0, чтобы указать, что у него есть A и B, но не C. и т.д. ...

И затем я использую:

 lm<-lm(Distance~A*B*C, data=data)
summary(lm)

, чтобы проверить вклад каждой мутацииРасстояние и посмотреть, являются ли какие-либо условия взаимодействия (например, A: B) значительными.При этом в качестве непрерывных переменных используются A, B и C (нарушение нормальности, но, по крайней мере, это подход).

С благодарностью за любую помощь, понимание или указания, на которые может указывать каждый.Применение этого подхода lm () работает с одной зависимой переменной и генотипами в качестве независимой переменной, но использование генотипов (включая взаимодействия) в качестве ковариат для второй независимой переменной - это то, чего я не видел в других вопросах.

1 Ответ

0 голосов
/ 25 мая 2018

С фиксированной моделью эффектов:

fit.null <- lm(Distance ~ A*B*C + Genotype)

fit.alt<- lm(Distance ~ A*B*C * Genotype)

и тестирование вложенных моделей с aov(fit.alt, fit.null).

Предположение: достаточная мощность и гомоскедастичность: простой трюк, перекрестная таблица freqs <- table(A, B, C, Genotype) и проверка any(freqs) < 5.Низкая точность означает низкое энергопотребление.

Аналог со смешанными эффектами, использующий критерий однородности дисперсии с lme4 (возможно, пользователь @BenBolker может прокомментировать оценку этой модели):

fit.null <- lmer(Distance ~ A*B*C + (1|Genotype))

fit.alt <- lmer(Distance ~ A*B*C + (A*B*C|Genotype))

Вы не можете тестировать вложенные модели здесь, потому что это проверка компонентов отклонения.Подобное тестирование моделей - это больше вопрос для stats.stackexchange.com

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...