Необходимо удалить строку, оставив только последние два символа в R - PullRequest
1 голос
/ 11 октября 2019

У меня есть data.frame, который я прочитал из CSV-файла. Эти данные имеют 440 строк и 900 столбцов. Мне нужно сосредоточиться на первом столбце и манипулировать строкой, чтобы в столбце оставалось только 2 символа для каждой строки. Эти данные также различаются по размеру. примеры:

4   ADCY7_S3
5   AIMP2_S5
6   ALKBH7_S5
7   ALOX5AP_S3

Мне нужна информация S1, S2, S3, S4 или S5.

1 Ответ

2 голосов
/ 11 октября 2019

Мы можем использовать substring из base R, если количество извлекаемых символов равно 2 из последней позиции каждой строки.

substring(v1, nchar(v1)-1)
#[1] "S3" "S5" "S5" "S3"

Или с sub для сопоставления символов до_ и замените его пустым ("")

sub(".*_", "", v1)

data

v1 <- c("ADCY7_S3", "AIMP2_S5", "ALKBH7_S5", "ALOX5AP_S3")
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...