Как отфильтровать столбец строк символов на основе их первого и третьего символов? - PullRequest
0 голосов
/ 01 мая 2020

У меня есть набор данных кодов ICD, 5 di git кодов, которые описывают диагноз пациентов больницы, который выглядит следующим образом (но с 16000 пациентами):

df <- c('S48.10', 'H38.13', 'R40.12')

Мне нужно отфильтровать их по первому символу S и третьему символу 8 для фильтрации пациентов с ампутацией. Любой совет, как это сделать?

1 Ответ

0 голосов
/ 01 мая 2020

Вот опция с grepl в столбце ICD. В качестве шаблона используется 'S', за которым следует любой символ (.), за которым следует 8 из начала (^) строки для фильтрации строк набора данных

subset(df1, grepl('^S.8', ICD))
...