Нахождение тенденции в болезненных состояниях в R - PullRequest
0 голосов
/ 08 мая 2018

У меня есть набор данных, в котором у меня есть несколько пациентов, их статус активности болезни и обилие специфических бактерий, как показано ниже:

**Patient** **DiseaseActivity** **Bacteria**
15  Severe  0.6704
15  Quiescent   0.0350
24  Quiescent   0.0137
24  Quiescent   0.0088
26  Quiescent   0.0023
26  Severe  0.0410
33  Quiescent   0.2031
33  Quiescent   0.0893
37  Quiescent   0.0345
37  Quiescent   0.0031
52  Quiescent   0.0601
52  Severe  0.0200
53  Severe  0.0050
53  Severe  0.2724
69  Severe  0.9369
69  Quiescent   0.0008
2   Severe  0.0421
2   Quiescent   0.0120
12  Severe  0.3109
12  Severe  0.0646
40  Quiescent   0.8048
40  Severe  0.9113
51  Severe  0.1918
51  Severe  0.9538

У каждого пациента есть две пробы, полученные в 2 разных момента времени. Когда я строю график один за другим, я вижу, что, когда тяжесть заболевания переходит от состояния покоя к серьезному, обилие бактерий увеличивается или тяжесть заболевания переходит от серьезного состояния к состоянию покоя, обилие бактерий уменьшается, даже если к этому типу относится только 6 пациентов. категория.

Мой вопрос: как я могу проверить, действительно ли это так, по крайней мере, для тех 6 пациентов или какой тип теста мне нужно сделать для этого типа набора данных? И если я хочу построить эти данные, какой будет самый точный способ построения данных?

Большое спасибо заранее.

1 Ответ

0 голосов
/ 08 мая 2018

Я не знаю, что такое «самый точный», и я не могу помочь вам с тем, какой тест использовать, это зависит от вашей аудитории, а также от ваших данных. Но вот один из возможных сюжетов?

change.df <- data.df%>%group_by(Patient)%>%summarize(status.change=paste(DiseaseActivity,collapse=""),bacteria.change=Bacteria[2]-Bacteria[1])
ggplot(change.df,aes(x=bacteria.change,y=status.change,color=status.change))+geom_point(size=5)+theme_bw()

Это предполагает, что у каждого пациента есть два момента времени, и они всегда находятся в порядке time1: time2, что довольно опасно! Время действительно должно быть записано в отдельном столбце.

...