Сравнение 2 наборов данных с использованием == - PullRequest
1 голос
/ 23 апреля 2020

Новичок ie здесь. Мне нужно найти похожие, но не идентичные элементы в двух разных наборах данных. В одном наборе данных есть столбец, который выглядит следующим образом:

ENST00000265620

Я хочу найти этот элемент в другом наборе данных, который называется GNAS_ENST с использованием ==, но GNAS_ENST выглядит следующим образом:

ENST00000265620.11 Следующий скрипт не работает:

GNAS_ENST$transcript_id == "ENST00000265620"

Я успешно использовал команду grep, полагая, что аналогичная вещь будет работать. Показано ниже

temp1[grep("^ENST[0-9]{11}.[0-9]{0-2}",GNAS_ENST$transcript_id),] 

, но когда я пытаюсь

GNAS_ENST$transcript_id == "ENST00000265620.[0-9]{0-2}"

и многочисленных вариаций на эту тему, это не работает. Я знаю, что

GNAS_ENST$transcript_id == "ENST00000265620.11"

работает. Мне просто нужна функция, чтобы игнорировать суффиксы .11 или .1 или .25. Я мог бы попытаться создать новый набор данных без .11, но не знаю, как удалить этот суффикс.

Кроме того,

"ENST00000265620" %in% GNAS_ENST

или наоборот не работает. Я думаю, что когда я go на самом деле сравниваю два набора данных, я буду использовать оператор% in%, но сначала я просто пробую что-то простое.

Любая помощь для новичка ie будет принята с благодарностью.

...