Как определить модельный организм из формата FASTA - PullRequest
0 голосов
/ 01 марта 2020

Итак, у меня есть такой формат:

1 Ответ

1 голос
/ 02 марта 2020

Ответчик может быть найден при просмотре OS части заголовка вашего файла FASTA. Но предположим, что у вас нет этой информации, тогда вы выполните поиск BLAST . Если буквы в вашей последовательности будут состоять только из A, T, C и G, это будет последовательность ДНК. Но поскольку они не являются, вы имеете дело с последовательностью белка. Поэтому нам нужно использовать белок BLAST .

Скопируйте / вставьте файл FASTA в онлайн-инструмент:

BLAST search

Оставьте остальные настройки по умолчанию и нажмите на BLAST кнопка. Через некоторое время вы получите следующие результаты:

BLAST results

Вы увидите, что найдено совпадение на 100% с Ruta graveolens (как упоминалось) в заголовке FASTA) и около 80% совпадения найдены в Citrus sinensis.

Если вы хотите узнать, к какому домену принадлежат эти виды, вы можете нажать на ссылку на записи о присоединении. Для Ruta graveolens это A9X7L0.1 . Там вы видите, что общее название этого растения: common rue , которое имеет следующую таксономию:

 Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta;
        Spermatophyta; Magnoliopsida; eudicotyledons; Gunneridae;
        Pentapetalae; rosids; malvids; Sapindales; Rutaceae; Rutoideae;
        Ruta.
...