Среднее время между двумя ответами в повторных измерениях в SAS - PullRequest
0 голосов
/ 08 ноября 2019

Я хочу рассчитать среднее время между двумя ответами на опрос. Я работаю с данными опроса с пятью наблюдениями. Анкеты рассылались каждые три года. Таким образом, разрыв между каждым последующим наблюдением составляет три года. В моих данных у меня есть индикаторная переменная «опрос №» со значениями 1, 2, 3, 4, 5. Время между опросом № 1 и № 2 = 3 года, между опросом №. = 1 и опрос №. = 3 - это 6 лет. Наибольшего разрыва между опросами нет. = 1 и опрос №. = 5 - это 12 лет. В мое исследование я включил участников, которые ответили минимум на два опроса, но у меня есть некоторые участники, которые ответили на все опросы, некоторые на три опроса, а некоторые на два опроса. Это дает несколько комбинаций количества лет на один идентификатор между двумя опросами. У меня есть составленный образец ниже.

data have;
input ID survey no. exposure;
1   2       0
1   3       1
2   1       1
2   1       1
2   3       0
2   4       0
2   5       1
3   1       0
3   2       1
3   3       1
3   4       0
3   5       1
;
run;

На этом изображении я попытался объяснить возможные комбинации между ответом на опрос для идентификатора

Я попытался создать синтаксисно это сложно, что я думал. Я новичок в SAS и не хочу предлагать какой-либо код.

Ниже я обновил свой вопрос.

Прошу прощения за глупые ошибки, которые я допустил в своем вопросе, я начал использовать SAS месяцтому назад. Ниже приведен образец из моего набора данных.

 DATA dummy;
InPuT id  survey_no  year  distance  bmi ;
*time= no. of survey;
* year= year when survey was conducted;
*distance = dichotomised exposure variable;
*bmi = continous outcome variable;
DATALINES;
1      4   2009     0      30.6689
1      6   2015     1      29.7004
2      4   2009     1      27.7744
2      6   2015     0      28.3782
3      1   2000     0      24.1140
3      2   2003     0      24.6914
3      3   2006     0      24.2188
3      4   2009     0      25.0000
3      5   2012     1      25.3086
3      6   2015     0      24.3827
4      4   2009     1      26.9531
4      5   2012     0      30.0914
4      6   2015     0      30.4688
5      1   2000     0      22.0386
5      2   2003     0      23.5078
5      4   2009     1      25.6544
5      5   2012     1      26.3980
5      6   2015     1      26.4463
;
run;

Опросы проводились в разные моменты времени, и респонденты не участвовали во всех опросах. Время между двумя опросами составляет 3 года. В простейшей форме мы оцениваем связь между «расстоянием» и «bmi». Расстояние дихотомически, а ИМТ непрерывный. Когда мы запускаем модель, SAS использует разные комбинации для 0 1, и этот ответ 0 1 происходит из разных временных точек, и разрыв между временными точками может варьироваться от 3 до 12 лет. Я хочу рассчитать среднее время, т.е. годы между двумя ответами, то есть расстояние с учетом нескольких комбинаций, в зависимости от количества участников опроса или года, в котором участвовали респонденты.

...