Модель повторяемости R (в rptR), неуверенная в формуле. Результат = нулевая повторяемость для нескольких моделей с предупреждением о подгонке по границе - PullRequest
1 голос
/ 10 июня 2019

Я анализирую повторяемость между различными когнитивными тестами (и повторениями этих тестов).Я пытаюсь определить индивидуальную повторяемость птиц, используя пакет rptR в R. Однако независимо от моей модели или того, что я тестирую, это всегда приводит к предупреждению и R = 0. Я пытаюсь понять, что вызывает это.

В настоящее время у меня есть фрейм данных, который включает в себя: идентификатор (повторяется дважды для каждого человека).Каждое повторение удостоверения личности сопровождается оценкой данного теста.Эти оценки сначала лог-преобразуются для достижения нормальности, а затем вычисляются Z-оценки этих показателей, чтобы я мог провести сравнение между тестами, измеряющими одну и ту же черту в разных шкалах.Однако независимо от того, как я настроил свою модель, с моими данными это всегда приводит к повторяемости R = 0.Хотя это технически возможно, я считаю маловероятным, чтобы он был настолько низким для всех параметров (поскольку я сравниваю как разные тесты, так и один и тот же тест, измеренный дважды).Более того, в каждой модели, которую я запускаю, я получаю предупреждение: «Граница (единственное число) соответствует: см. IsSingular».Из того, что я собрал, это означает, что разница в моих данных может быть слишком мала, хотя я не совсем уверен в этом.И я беспокоюсь, что это может быть причиной моего R = 0.

Фрагмент моего фрейма данных выглядит следующим образом: RNR_ID RoundNR TTC TTC_Z Test_date 2 1 1 28 0.0966013973 43423 114 1 2 14 -0.8138678026 43543 5 2 1 48 0.8045891472 43425 122 2 2 31 0.2302959586 43549

Пример двух вариантов моих моделей: Неприспособленный R:

Rep1_Assoc_A <- rpt(TTC_Z ~ RoundNR + (1|RNR_ID), grname = "RNR_ID", data = rpt_Assoc_A_df, datatype = "Gaussian", nboot = 10, npermut = 10)

Скорректированный R (В котором я контролирую дату теста в надежде учесть обучение отдельных лиц между повторениями одного и того же теста):

Rep2_Assoc_A <- rpt(TTC_Z ~ RoundNR + Test_date + (1|RNR_ID), grname = "RNR_ID", data = rpt_Assoc_A_df, datatype = "Gaussian", nboot = 10, npermut = 10)

Примечание: RNR_ID, RoundNR и TTC_Z являются числовыми переменными.Test_date указан в формате Date, хотя я не уверен, как модель справится с этим.В этой модели RoundNR указывает «обработку» (поскольку это указывает, был ли тест первым или вторым разом, когда индивидуум был оценен).TTC_Z указывает Z-оценку индивидуума.

И полученный результат соответственно:

Repeatability estimation using the lmm method 

Repeatability for RNR_ID
R  = 0
SE = 0.107
CI = [0, 0.283]
P  = 1 [LRT]
     1 [Permutation]

Repeatability estimation using the lmm method 

Repeatability for RNR_ID
R  = 0
SE = 0.12
CI = [0, 0.337]
P  = 1 [LRT]
     1 [Permutation]

Как указано ранее, во время выполнения этого кода консоль выдает несколько: boundary (singular) fit: see ?isSingular сообщений вмне.Я также попробовал поддельный набор данных, в котором я настроил все значения повторений так, чтобы они были почти идентичными, что действительно приводит к высокому значению R (около 0,9 ...).Хотя это говорит о том, что мой R = 0 на самом деле может быть правильным, я все еще скептически отношусь к этому, потому что это не только неожиданно (как и следовало ожидать, по крайней мере, очень низкий, но измеримый R).Но из-за недостатка понимания модели я боюсь, что что-то еще может пойти не так.

Подводя итог, я могу задать следующие вопросы:

В1: Верны ли текущие формулы для моих моделей??И есть ли переменные в правильных типах данных?

Q2: Что означает boundary (singular) fit: see ?isSingular в этой ситуации, и могу ли я «исправить» это?

Q3: Что может быть причиной моегоR = 0?Я неправильно анализирую свои данные или мой R просто 0?

1 Ответ

0 голосов
/ 24 июня 2019

Хотя это еще не полный ответ, у меня, по крайней мере, есть частичные ответы на мои вопросы после разговора с некоторыми коллегами.

В1: Да и нет, способ, которым я настраиваю свою формулу, полностью подходит.Однако я включил некоторые факторы, которые (в моем случае) были излишними.Первоначально я добавил RoundNR как фактор, чтобы попытаться исправить ситуацию.Тем не менее, это не имеет никакого смысла, так как у меня есть только два раунда, и, таким образом, я считаю, что все мои вариации будут отнесены к этому фактору.Взятия Z-показателей было достаточно.Что касается test_date, это может быть интересно, если это не будет сильно перепутано с моими тестами.Хотя в более общем плане (для других людей): широкие линии модели были в порядке.Просто будьте осторожны, какие фиксированные эффекты включить.

Q2: Мне все еще не совсем ясно, в чем смысл, поэтому, если кто-то еще сможет дать более четкое объяснение, тогда это будет оценено.Однако, как я понимаю, это просто следствие моих данных, а не проблема, например, с моей моделью.

Q3: Совершенно очевидный ответ: мои собственные данные.Коллега провел быстрый анализ с помощью другого метода (который дает менее точные, но более быстрые оценки повторяемости), а также обнаружил R = 0 (или, по крайней мере, очень близко к нему).

Не полный ответ, но я надеюсь, что это поможет другим в будущем.

...