Question

Учитывая эти входные данные:

my $init_seq = "AAAAAAAAAA" #length 10 bp 
my $sub_rate = 0.003;
my $nof_tags = 1000;
my @dna = qw( A C G T );

Я хочу сгенерировать:

Тысяча длин-10 меток
Коэффициент замещения для каждой позиции в теге составляет 0,003

Выходная мощность, например:

AAAAAAAAAA
AATAACAAAA
.....
AAGGAAAAGA # 1000th tags

Есть ли компактный способ сделать это в Perl?

Я застрял с логикой этого скрипта в качестве ядра:

#!/usr/bin/perl

my $init_seq = "AAAAAAAAAA" #length 10 bp 
my $sub_rate = 0.003;
my $nof_tags = 1000;
my @dna = qw( A C G T );

    $i = 0;
    while ($i < length($init_seq)) {
        $roll = int(rand 4) + 1;       # $roll is now an integer between 1 and 4

        if ($roll == 1) {$base = A;}
        elsif ($roll == 2) {$base = T;}
        elsif ($roll == 3) {$base = C;}
        elsif ($roll == 4) {$base = G;};

        print $base;
    }
    continue {
        $i++;
    }

Penfold · Answer 1 · 02 марта 2009

В качестве небольшой оптимизации замените:

    $roll = int(rand 4) + 1;       # $roll is now an integer between 1 and 4

    if ($roll == 1) {$base = A;}
    elsif ($roll == 2) {$base = T;}
    elsif ($roll == 3) {$base = C;}
    elsif ($roll == 4) {$base = G;};

с

    $base = $dna[int(rand 4)];

Mitch Wheat · Answer 2 · 02 марта 2009

РЕДАКТИРОВАТЬ: Предполагая, что коэффициент замещения находится в диапазоне от 0,001 до 1000:

Как и $roll, сгенерируйте другое (псевдо) случайное число в диапазоне [1..1000], если оно меньше или равно (1000 * $ sub_rate), затем выполните подстановку, в противном случае ничего не делайте ( т.е. вывод 'A').

Имейте в виду, что вы можете внести незначительное смещение, если не известны свойства вашего генератора случайных чисел.

brunov · Answer 3 · 02 марта 2009

Не совсем то, что вы ищете, но я предлагаю вам взглянуть на модуль Bio :: SeqEvolution :: DNAPoint компании BioPerl. Это не берет уровень мутации как параметр все же. Скорее, он спрашивает, какую нижнюю границу идентичности последовательности вы хотите получить от оригинала.

use strict;
use warnings;
use Bio::Seq;
use Bio::SeqEvolution::Factory;

my $seq = Bio::Seq->new(-seq => 'AAAAAAAAAA', -alphabet => 'dna');

my $evolve = Bio::SeqEvolution::Factory->new (
   -rate     => 2,      # transition/transversion rate
   -seq      => $seq
   -identity => 50      # At least 50% identity with the original
);


my @mutated;
for (1..1000) { push @mutated, $evolve->next_seq }

Все 1000 мутированных последовательностей будут сохранены в массиве @mutated, к их последовательностям можно получить доступ методом seq.

Ismael · Answer 4 · 05 марта 2009

Не знаю, правильно ли я понимаю, но я бы сделал что-то вроде этого (псевдокод):

digits = 'ATCG'
base = 'AAAAAAAAAA'
MAX = 1000
for i = 1 to len(base)
  # check if we have to mutate
  mutate = 1+rand(MAX) <= rate*MAX
  if mutate then
    # find current A:0 T:1 C:2 G:3
    current = digits.find(base[i])
    # get a new position 
    # but ensure that it is not current
    new = (j+1+rand(3)) mod 4        
    base[i] = digits[new]
  end if
end for

j_random_hacker · Answer 5 · 03 марта 2009

В случае замены вы хотите исключить текущую базу из возможностей:

my @other_bases = grep { $_ ne substr($init_seq, $i, 1) } @dna;
$base = @other_bases[int(rand 3)];

Также см. ответ Митча Уайта о том, как реализовать коэффициент замещения.

Генерирование синтетической последовательности ДНК с частотой замещения

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 5 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Генерирование синтетической последовательности ДНК с частотой замещения

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 5 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы