У меня есть DF с информацией о 2 лабораторных тестах: AST и THR.Столбцы следующие:
> names(lab_temp)
[1] "PATIENT" "PROGRAM" "LAB_D" "LAB_V" "LAB_ID"
Для каждого пациента может быть несколько LAB_D (лабораторные даты) и несколько тестов с одним и тем же идентификатором (AST или THR).Например,
пациент 1 может пройти следующие тесты:
ast 2005/08/02
thr 2005/08/02
thr 2005/12/05
ast 2006/05/13
thr 2006/05/20
ниже приведены «реальные» данные
PATIENT PROGRAM LAB_D LAB_V LAB_ID
3791 CEPREFCP0003 CEPREF 2005-06-21 116.0 AST
3957 CEPREFCP0003 CEPREF 2005-06-21 77000.0 THR
3958 CEPREFCP0003 CEPREF 2005-08-30 138000.0 THR
9118 CEPREFCP0007 CEPREF 2004-04-07 173000.0 THR
9119 CEPREFCP0007 CEPREF 2004-09-10 79000.0 THR
8615 CEPREFCP0007 CEPREF 2004-09-13 289.0 AST
10541 CEPREFCP0010 CEPREF 2004-06-04 149000.0 THR
10258 CEPREFCP0010 CEPREF 2004-09-10 364.0 AST
10542 CEPREFCP0010 CEPREF 2004-09-10 96000.0 THR
10569 CEPREFCP0012 CEPREF 2007-02-09 16.0 AST
10854 CEPREFCP0012 CEPREF 2007-02-09 304000.0 THR
15157 CEPREFCP0019 CEPREF 2009-09-21 22.0 AST
15439 CEPREFCP0019 CEPREF 2009-09-21 394000.0 THR
, что мне нужно, это новый столбецс разницей в датах двух ближайших лабораторных испытаний.Таким образом, для бывшего пациента 1 ast 2005/08/02 - 2005/08/02 th 2005/12/05 - этот показатель не будет включен в расчет, поскольку ни один из тестов ast не будет "совпадать" с ast 2006/05/13 -Четверг 2006/05/20
Надеюсь, я ясно дал понять.Ваша помощь очень ценится