R Как визуализировать парное выравнивание - PullRequest
0 голосов
/ 17 сентября 2018

Как визуализировать полное выравнивание двух последовательностей?

library(Biostrings)
s1 <-DNAString("ACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGTTTTCACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGTTTTCAAGAAGACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGTTTTCAAG")
s2 <-DNAString("GTTTCACTACTTCCTTTCGGGTAAGTAAATATATGTTTCACTACTTCCTTTCGGGTAAGTGTTTCACTACTTCCTTTCGGGTAAGTAAATATATAAATATATAAAAATATAATTTTCATCAAATATATAAATATATAAAAATATAATTTTCATCAAATATATAAAAATATAATTTTCATC")
pairwiseAlignment(s1,s2)

Вывод:

Global PairwiseAlignmentsSingleSubject (1 of 1)
pattern: [1] ACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGT--TTTCAC---...CTTCACCAGCTCCCTGGCGGTAAGTTG-ATCAAAGG---AAACGCAAAGTTTTCAAG 
subject: [1] GTTTCACTACTTCCTTTCGGGTAAGTAAAT-ATATGTTTCACTACTTCCTTTCGGGTA...TATATAAATATATAAAAATATAATTTTCATCAAATATATAAAAATATAATTTTCATC 
score: -394.7115 

Здесь показана только часть выравнивания?Знаете ли вы о каких-либо существующих функциях, которые либо отображают, либо печатают выравнивание?

1 Ответ

0 голосов
/ 17 сентября 2018

Вы можете найти информацию и подробности о том, как извлечь выровненный шаблон и предметные последовательности в ?pairwiseAlignments.

Вот пример на основе предоставленных вами образцов данных:

  1. Сохранение попарного выравнивания в PairwiseAlignmentsSingleSubject объекте

    alg <- pairwiseAlignment(s1,s2)
    
  2. Извлеките выровненный образец и предметные последовательности и объедините их в DNAStringSet объект.

    seq <- c(alignedPattern(alg), alignedSubject(alg))
    
  3. Вы можете получить доступ к полным последовательностям с помощью as.character

    as.character(seq)
    [1] "ACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAACGCAAAGT--TTTCAC--------TTCACCAGCTCCCTGGCGGTAAGTTGATC---AAAGG---AAACGCAAAGTTTTCAAGAAGACTTCACCAGCTCCCTGGCGGTAAGTTG-ATCAAAGG---AAACGCAAAGTTTTCAAG"
    [2] "GTTTCACTACTTCCTTTCGGGTAAGTAAAT-ATATGTTTCACTACTTCCTTTCGGGTAAGTGTTTCACTACTTCCTTTCGGGTAAGTAAATATATAAATATATAAAAATATAATTTTCATCAA-ATATATAAATATATAAAAATATAATTTTCATCAAATATATAAAAATATAATTTTCATC"
    

    Кажется, что alignedPattern и alignedSubject были добавлены к Biostrings совсем недавно.В качестве альтернативы вы можете сделать

    seq <- c(aligned(pattern(alg)), aligned(subject(alg)))
    

    , но учтите, что это обрезает глобально выровненные последовательности (см. details ).

  4. Существует замечательный пакет R / Bioconductor DECIPHER, который предлагает метод визуализации данных XStringSet в веб-браузере.Он автоматически добавляет цветовое кодирование и согласованную последовательность внизу.В вашем случае вы бы сделали

    library(DECIPHER)
    BrowseSeqs(seq)
    

    enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...