Как мне создать шаблон kmer в Unix для данной строки? - PullRequest
0 голосов
/ 24 октября 2018

У меня есть строка с именем mystring=AACTCGCTTT.Я хочу создать шаблон этой строки, допускающий 4 несоответствия или kmer = 6, начиная с первой буквы и заканчивая последней последней буквой.Я хочу это, чтобы я мог grep эти шаблоны в текстовом файле.Как мне это сделать в Bash?Так что мой шаблон будет выглядеть так:

????CGCTTT
A????GCTTT
AA?T???TTT

1 Ответ

0 голосов
/ 24 октября 2018

Для этой цели существует инструмент под названием agrep:

agrep -4 AACTCGCTTT filename

Со страницы руководства:

Поиск приблизительных совпадений PATTERNв каждом ФАЙЛЕ или стандартном вводе.Пример: «agrep -2 optimize foo.txt» выводит все строки в файле «foo.txt», которые соответствуют «optimize» с двумя ошибками.Например, все строки, содержащие «optimize», «optmise» и «opitmize», совпадают.

...