Я пытаюсь объединить перекрывающиеся чтения в файле bam с одним длинным чтением in silico.
Пример:
chr1 1 4 ACAC
chr1 3 6 ACTT
chr1 6 9 TGGG
chr1 11 14 ACTG
Желаемый результат:
chr1 1 9 ACACTTGGG
chr1 11 14 ACTG
Я пробовал bedtools merge
, который дает мне начальную и конечную позицию объединенных чтений, даже идентификаторы подсчета и чтения перекрывающихся и объединенных чтений, но, к сожалению, не фактическую последовательность объединенного чтения. Я также читал о получении согласованной последовательности из файлов bam и вырезании перекрывающихся пар чтения, но все это не то, чего я хочу достичь. Любая помощь приветствуется! Спасибо!