Извлечение данных из столбца для создания другого столбца в R - PullRequest
0 голосов
/ 21 октября 2018

У меня есть фрейм данных с 3 переменными, которые я хотел бы разделить на 4 переменные.Фрейм данных выглядит следующим образом:

Species_Name    SIXTEENS_Title                           SIXTEENS_Sequence
Daphnia magna   LC382445.1 Daphnia magna mitochondrial   TTCGGAGAAAAGGGGTAC...
Daphnia magna   KY694374.1 Daphnia magna mitochondrial   TTCGGAGAAAAGGGGTAC...

Из этого фрейма данных под SIXTEENS_Title я хочу извлечь все до Daphnia (буквенно-цифровой LC382445.1, KY694374.1; но естьболее 100 наблюдений с разными числами).

Я пытался использовать str_extract() и str_detect(), но я не могу этого сделать.Я хочу использовать регистрационные номера (LC382445.1), чтобы создать еще один столбец в R.

1 Ответ

0 голосов
/ 21 октября 2018

Вы можете сделать это с помощью sub и регулярного выражения.

df = read.table(text="Species_Name    SIXTEENS_Title         SIXTEENS_Sequence
'Daphnia magna'   'LC382445.1 Daphnia magna mitochondrial'   'TTCGGAGAAAAGGGGTAC...'
'Daphnia magna'   'KY694374.1 Daphnia magna mitochondrial'   'TTCGGAGAAAAGGGGTAC...'",
header=T, stringsAsFactors=F)

sub("\\s*Daphnia.*", "", df$SIXTEENS_Title)
[1] "LC382445.1" "KY694374.1"
...