Я пытаюсь очистить свои данные некоторых наблюдений. Я только хочу сохранить строки, в которых одна из моих 10 переменных, по крайней мере, в одном месте, содержит определенное значение (код). Набор данных очень большой и может содержать огромное количество значений для переменных. Я мог бы только хотеть держать строки, где есть наблюдения, начинающиеся с 'C'. Они могут быть закодированы как что-нибудь между C000 до CA798 и так далее. Я также хочу сохранить строку, если где-то есть другое наблюдение, но на этот раз это могут быть UG63000 до UG68999 и UG74. Один из требуемых кодов должен появляться только один раз в строке, но если где-то в строке есть несколько требуемых кодов, это не проблема. Позже я хочу закодировать их так, чтобы там, где когда-либо существовало одно из интересующих меня значений, я получал 1.
Таким образом, проблема заключается в обобщении условия удаления / сохранения для кодов с определенными значениями без необходимости жесткого кодирования каждого из возможных значений, таких как:
сохранить, если переменная1 = C000 или если переменная1 = C0001, или если переменная2 = C000, или если переменная2 = UG63
и т. д.
Строка может выглядеть так:
ID Var1 Var2 ... Var10
Xyz C700 TI0213 ... Z892DA