Я хочу рассчитать среднее время между двумя ответами на опрос. Я работаю с данными опроса с пятью наблюдениями. Анкеты рассылались каждые три года. Таким образом, разрыв между каждым последующим наблюдением составляет три года. В моих данных у меня есть индикаторная переменная «опрос №» со значениями 1, 2, 3, 4, 5. Время между опросом № 1 и № 2 = 3 года, между опросом №. = 1 и опрос №. = 3 - это 6 лет. Наибольшего разрыва между опросами нет. = 1 и опрос №. = 5 - это 12 лет. В мое исследование я включил участников, которые ответили минимум на два опроса, но у меня есть некоторые участники, которые ответили на все опросы, некоторые на три опроса, а некоторые на два опроса. Это дает несколько комбинаций количества лет на один идентификатор между двумя опросами. У меня есть составленный образец ниже.
data have;
input ID survey no. exposure;
1 2 0
1 3 1
2 1 1
2 1 1
2 3 0
2 4 0
2 5 1
3 1 0
3 2 1
3 3 1
3 4 0
3 5 1
;
run;
На этом изображении я попытался объяснить возможные комбинации между ответом на опрос для идентификатора
Я попытался создать синтаксисно это сложно, что я думал. Я новичок в SAS и не хочу предлагать какой-либо код.
Ниже я обновил свой вопрос.
Прошу прощения за глупые ошибки, которые я допустил в своем вопросе, я начал использовать SAS месяцтому назад. Ниже приведен образец из моего набора данных.
DATA dummy;
InPuT id survey_no year distance bmi ;
*time= no. of survey;
* year= year when survey was conducted;
*distance = dichotomised exposure variable;
*bmi = continous outcome variable;
DATALINES;
1 4 2009 0 30.6689
1 6 2015 1 29.7004
2 4 2009 1 27.7744
2 6 2015 0 28.3782
3 1 2000 0 24.1140
3 2 2003 0 24.6914
3 3 2006 0 24.2188
3 4 2009 0 25.0000
3 5 2012 1 25.3086
3 6 2015 0 24.3827
4 4 2009 1 26.9531
4 5 2012 0 30.0914
4 6 2015 0 30.4688
5 1 2000 0 22.0386
5 2 2003 0 23.5078
5 4 2009 1 25.6544
5 5 2012 1 26.3980
5 6 2015 1 26.4463
;
run;
Опросы проводились в разные моменты времени, и респонденты не участвовали во всех опросах. Время между двумя опросами составляет 3 года. В простейшей форме мы оцениваем связь между «расстоянием» и «bmi». Расстояние дихотомически, а ИМТ непрерывный. Когда мы запускаем модель, SAS использует разные комбинации для 0 1, и этот ответ 0 1 происходит из разных временных точек, и разрыв между временными точками может варьироваться от 3 до 12 лет. Я хочу рассчитать среднее время, т.е. годы между двумя ответами, то есть расстояние с учетом нескольких комбинаций, в зависимости от количества участников опроса или года, в котором участвовали респонденты.