Новичок ie здесь. Мне нужно найти похожие, но не идентичные элементы в двух разных наборах данных. В одном наборе данных есть столбец, который выглядит следующим образом:
ENST00000265620
Я хочу найти этот элемент в другом наборе данных, который называется GNAS_ENST с использованием ==, но GNAS_ENST выглядит следующим образом:
ENST00000265620.11 Следующий скрипт не работает:
GNAS_ENST$transcript_id == "ENST00000265620"
Я успешно использовал команду grep, полагая, что аналогичная вещь будет работать. Показано ниже
temp1[grep("^ENST[0-9]{11}.[0-9]{0-2}",GNAS_ENST$transcript_id),]
, но когда я пытаюсь
GNAS_ENST$transcript_id == "ENST00000265620.[0-9]{0-2}"
и многочисленных вариаций на эту тему, это не работает. Я знаю, что
GNAS_ENST$transcript_id == "ENST00000265620.11"
работает. Мне просто нужна функция, чтобы игнорировать суффиксы .11 или .1 или .25. Я мог бы попытаться создать новый набор данных без .11, но не знаю, как удалить этот суффикс.
Кроме того,
"ENST00000265620" %in% GNAS_ENST
или наоборот не работает. Я думаю, что когда я go на самом деле сравниваю два набора данных, я буду использовать оператор% in%, но сначала я просто пробую что-то простое.
Любая помощь для новичка ie будет принята с благодарностью.