Python найти самый длинный ORF - PullRequest
0 голосов
/ 10 апреля 2020

Может ли кто-нибудь показать мне простое решение о том, как рассчитать самую длинную открытую рамку считывания (ORF) длиной> 30 п.н. в последовательности ДНК? ATG является стартовым кодоном (т. Е. Началом ORF), а TAG, TGA и TAA являются стоп-кодонами (т. Е. Концом ORF). Без использования Био Python.

1 Ответ

1 голос
/ 10 апреля 2020

Это регулярное выражение может выполнять эту работу:

ATG(...){30,}(TAG|TGA|TAA)

(...) - трехбуквенный кодон, который встречается 30 или более раз с {30,} и останавливается всякий раз, когда находит один из (TAG|TGA|TAA).

Это регулярное выражение может помочь вам найти все ORF, и теперь вам просто нужно найти самое длинное, которое должно быть тривиальным.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...