romove строки с некоторым конкретным значением в столбцах - PullRequest
0 голосов
/ 26 июня 2018

Я хочу удалить строки, содержащие chr1_ _random, а затем отсортировать данные по столбцам chr и start:

данные:

Coordinates                                         chr     start       end                                              
chr1_gl000191_random:25220-31247 chr1_gl000191_random     25220     31247                                 
chr1_gl000191_random:28291-31301 chr1_gl000192_random     28291     31301  
chr1:100015775-100016525                         chr1 100015775 100016525       
chr1:10001650-10004925                           chr1  10001650  10004925

выход:

Coordinates                                         chr     start       end                                               
chr1:10001650-10004925                           chr1  10001650  10004925
chr1:100015775-100016525                         chr1 100015775 100016525

Спасибо за любые предложения заранее!

1 Ответ

0 голосов
/ 26 июня 2018

Для удаления строк, содержащих chr1_ _random используйте

data <- data[grepl("chr1\\_.*\\_random", data$chr) == FALSE,]

Тогда для сортировки используйте

attach(data)
data = data[order(start, end),]
detach(data)
...