У меня есть набор данных, который выглядит примерно так:
long_name x y short_name
Adhesion G protein-coupled receptor E2 (ADGRE2) 10 10 ADGRE2
Adhesion G-protein coupled receptor G2 (ADGRG2) 12 12 ADX2
ADM (ADM) 13 13 ADM
ADP-ribosyl cyclase/cyclic ADP-ribose hydrolase 1 (CD38) 14 14 ACH1
Я хочу создать дополнительный столбец, в котором будет указано, является ли значение short_name
значением long_name
для получения значения ИСТИНА / ЛОЖЬ (или присутствует / нет) в новом столбце.
Здесь я увидел несколько советов по использованию функции grepl
для поиска фрагмента строки в другой строке.,Проблема, с которой я сталкиваюсь, заключается в том, чтобы попытаться выполнить итерацию по всему файлу.
У меня есть что-то вроде:
for (row in 1:length(nrows(combined_proteins))){
long_name = proteins[1]
short_name = proteins[4]
if grepl(short_name, long_name) = TRUE{
proteins$presence = "Present"
else proteins$presence = "Not"
}
}
Но это, очевидно, не работает, и я не совсем уверенбудь это даже самый умный способ сделать это.Любая помощь приветствуется.