Я хотел бы удалить строки, в которых значение конкретной переменной, HEIGHT_CM
, сильно отличается от других значений для того же идентификатора, PATIENT_ID
.
- Отличие> 2 от других значений
Данные:
df <- read.table(text = "PATIENT_ID MEASUREMENT_TAKEN_DATE HEIGHT_CM
1 20140305 163
1 20140409 163
1 20140528 164
1 20140730 164
1 20141210 99.7
2 20140305 155
2 20140527 157
2 20141111 78
3 20140721 90
4 20140528 168
4 20140627 167
4 20140917 167
4 20141002 70", header = TRUE, stringsAsFactors = FALSE)
Желаемый выход :
df <- read.table(text = "PATIENT_ID MEASUREMENT_TAKEN_DATE HEIGHT_CM
1 20140305 163
1 20140409 163
1 20140528 164
1 20140730 164
2 20140305 155
2 20140527 157
3 20140721 90
4 20140528 168
4 20140627 167
4 20140917 167", header = TRUE, stringsAsFactors = FALSE)