пакет lavaan - тестирование идеальной модели как-то поднимает RMSEA = 0,77 - PullRequest
2 голосов
/ 23 февраля 2020

Я смотрю на факторные модели вопросника из 75 вопросов.

Перед тестированием своих моделей я подумал, что просто протестирую идеальную модель: однофакторную модель, включающую все 75 вопросов.

Я думал, что это должно объяснить все различия в данных, и что RMSEA должно быть 0, но это приводит к RMSEA = 0,77, что заставляет меня думать, что что-то не так в моем коде. Это звучит правильно? Или кто-нибудь знает, что еще может быть не так?

Спасибо

one.factor <- 'F1 =~ Q1 + Q2 + Q3 + Q4 + Q5 + Q6 + Q7 + Q8 + Q9 + Q10 + Q11 + Q12 + Q13 + Q14 + Q15 + + Q16 + Q17 + Q18 + Q19 + Q20 + Q21 + Q22 + Q23 + Q24 + Q25 + Q26 + Q27 + Q28 + Q29 + Q30 + Q31 + Q32 + Q33 + Q34 + Q35 + Q36 + Q37 + Q38 + Q39 + Q40 + Q41 + Q42 + Q43 + Q44 + Q45 + Q46 + Q47 + Q48 + Q49 + Q50 + Q51 + Q52 + Q53 + Q54 + Q55 + Q56 + Q57 + Q58 + Q59 + Q60 + Q61 + Q62 + Q63 + Q64 + Q65 + Q66 + Q67 + Q68 + Q69 + Q70 + Q71 + Q72 + Q73 + Q74 + Q75'
fit <- cfa(one.factor, data=cfa.data)
summary(fit, fit.measures=TRUE)

1 Ответ

0 голосов
/ 23 февраля 2020

Прошло много времени с тех пор, как я работал со скрытыми моделями, так что я могу быть немного не в себе. Но ваши заявления звучат неправильно. Вы утверждаете, что ваша модель идеальна, однако я не понимаю, почему это так. В лучшем случае это нулевая модель, что означает, что это хорошая основа для сравнения других моделей, чтобы оценить, являются ли они улучшением. Если бы я сравнил его с Mplus (программой, с которой я работал больше всего), это означало бы:

Хотя базовая модель в большинстве компьютерных программ SEM представляет собой то, что обычно называют моделью модели независимости (или нулевой), Базовая модель в Mplus несколько отличается. Общим для обеих базовых моделей является предположение о нулевой ковариации среди наблюдаемых переменных показателей. Однако, в то время как единственными параметрами в модели независимости, относящимися к модели CFA, являются наблюдаемые переменные отклонения (учитывая, что оцениваемые средние значения не представляют интереса), значения в базовой модели Mplus включают в себя как отклонения, так и средние значения (т.е. перехваты) наблюдаемых переменные. [...] Поскольку базовые модели предполагают нулевую ковариацию среди наблюдаемых переменных, неудивительно, что значение хи-квадрат в этих моделях обычно всегда значительно больше, чем в структурированной гипотетической модели.

Я думаю, что для вашего кода вы не получите совместные вариации между наблюдаемыми переменными, поэтому все вариации будут отражены в одном указанном факторе. По крайней мере, я проверил этот учебник по lavaan , чтобы быть уверенным, что я не помню его неправильно, и ваш код кажется очень простым / минимальным CFA. Это делает меня базовой моделью.

Я не знаю, что вы имеете в виду под идеальной моделью. Единственное, что я могу себе представить, это модель, которая учитывает все вариации, непосредственно наблюдаемые в данных.

Насыщенная модель - это модель, в которой число оценочных параметров равно количеству точек данных [...] В отличие от базовой (или независимой) модели, которая является наиболее строгой моделью SEM насыщенная модель является наименее ограниченной моделью СЭМ. Концептуализируя в рамках континуума, насыщенная модель будет представлять одну конечную точку, тогда как модель независимости будет представлять другую; гипотетическая модель всегда будет представлять точку где-то между ними.

Однако ваша модель не насыщена. Вы не указываете в своем коде c, что модель должна оценивать первый коэффициент. То есть из вашего кода я предполагаю, что вы получаете коэффициенты для всех переменных, кроме первой. Это будет / должно быть 1. Это немного помогло бы, если бы вы предоставили некоторые данные для фактического тестирования, но у меня нет оснований ожидать, что в противном случае вы будете проверять ваш код по сравнению с тем, что есть в учебнике по lavaan .

Я полагаю, однако, что насыщенная модель не идентифицирована и поэтому не будет работать. Это теоретическая модель, используемая для оценки подходящих показателей, но я не совсем понимаю, почему вы захотите смоделировать ее самостоятельно. Основная цель моделирования - найти наиболее экономную модель, «идеальную модель», которая учитывает все вариации в данных, не экономна и, следовательно, редко представляет интерес.

Однако я не помню, является ли RMSEA индикатором насыщенной модели. Я знаю, что RMSEA 0 будет иметь место, когда ваши степени свободы больше, чем хи-квадрат. При рассмотрении значения RMSEA

индексы абсолютного соответствия не полагаются на сравнение с эталонной моделью при определении степени улучшения модели; скорее они зависят только от определения того, насколько хорошо предполагаемая модель соответствует выборочным данным. [..] RMSEA учитывает погрешность аппроксимации в совокупности и задает вопрос «Насколько хорошо модель с неизвестными, но оптимально подобранными значениями параметров соответствовала бы матрице дисперсии совокупности, если бы она была доступна?». Это несоответствие, измеренное RMSEA, выражается на степень свободы, что делает его чувствительным к количеству оценочных параметров в модели.

Другими словами, ожидание RMSEA 0 означает, что вы ожидаете, что значения в вашей модели точно такие же, как и в популяции. Я не думаю, что это очень вероятная ситуация.

Для меня ваша RMSEA является показателем того, что ваша однофакторная модель не соответствует данным, что с психологической точки зрения (моя область) было бы невероятно Удивительно, если бы это было. Вы можете сравнить эту модель с более подходящими моделями, такими как модели с двумя, тремя или другим числом факторов. Из этого, выберите наиболее подходящую наиболее экономную модель. Но, пожалуйста, не просто начните случайную оценку X числа факторных моделей. Делай это в курсе. Я видел так много исследователей, которые просто запускали множество моделей CFA с различными вариациями только для того, чтобы выбрать те, которые им нравятся, что не является хорошим способом выполнения статистики.

Пожалуйста, посетите веб-сайт Дэвида Кенни для получения более общей информации

Источник для моих предложений: моделирование структурных уравнений с помощью Mplus: основы, приложения и программирование на основе c. От Барбары М. Бирн (2012)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...