Я обновил вопрос с помощью псевдокода, чтобы лучше объяснить, что я хотел бы сделать.
У меня есть data.frame с именем df_sel , с 5064 строками и 215 столбцами.
В некоторых столбцах (~ 80) содержатся целые числа с уникальным идентификатором для определенной черты (лекарства).Эти столбцы называются «meds_0_1», «meds_0_2», «meds_0_3» и т. Д., А также «meds_1_1», «meds_1_2», «meds_1_3».Каждый столбец может содержать или не содержать какие-либо целочисленные значения, которые я ищу.
Чтобы найти конкретные целочисленные значения, некоторые из них можно сгруппировать по разным типам лекарств, но закодировать для конкретных торговых марок.
metformin = 1140884600 # not grouped
sulfonylurea = c(1140874718, 1140874724, 1140874726) # grouped
Если бы можно было найти группу лекарств, как в векторном формате, как указано выше, это было бы полезно.
Я бы хотел сделать это:
IF [a specific row]
CONTAINS [the single integer value of interest]
IN [any of the columns within the df starting with "meds_0"]
A_NEW_VARIABLE_METFORMIN = 1 ELSE A_NEW_VARIABLE_METFORMIN = 0
и соответственно
IF [a specific row]
CONTAINS [any of multiple integer values of interest]
IN [any of the columns within the df starting with "meds_0"]
A_NEW_VARIABLE_SULFONYLUREA = 1 ELSE A_NEW_VARIABLE_SULFONYLUREA = 0
Мне удалось создать вектор на основе имен столбцов:
column_names <- names(df_sel) %>% str_subset('^meds_0')
Но я не получил ничего, несмотря нанекоторые предложения ниже.
Надеюсь, вы лучше понимаете, что я пытаюсь сделать.