Я пытаюсь выполнить фильтрацию на основе композиции для большого набора строк (белковых последовательностей).
Я написал группу из трех подпрограмм, чтобы позаботиться об этом, но у меня две проблемы - одна второстепенная, одна главная. Незначительная проблема в том, что когда я использую List :: MoreUtils 'pairwise' , я получаю предупреждения об использовании $a
и $b
только один раз, и они не инициализируются. Но я считаю, что я вызываю этот метод правильно (основываясь на записи CPAN для него и некоторых примерах из Интернета).
Главная проблема - ошибка "Can't use string ("17/32") as HASH ref while "strict refs" in use..."
Кажется, что это может произойти, только если цикл foreach
в &comp
передает значения хеш-функции в виде строки вместо оценки операции деления. Я уверен, что сделал ошибку новичка, но не могу найти ответ в Интернете. Первый раз, когда я даже посмотрел на код perl, был в прошлую среду ...
use List::Util;
use List::MoreUtils;
my @alphabet = (
'A', 'R', 'N', 'D', 'C', 'Q', 'E', 'G', 'H', 'I',
'L', 'K', 'M', 'F', 'P', 'S', 'T', 'W', 'Y', 'V'
);
my $gapchr = '-';
# Takes a sequence and returns letter => occurrence count pairs as hash.
sub getcounts {
my %counts = ();
foreach my $chr (@alphabet) {
$counts{$chr} = ( $_[0] =~ tr/$chr/$chr/ );
}
$counts{'gap'} = ( $_[0] =~ tr/$gapchr/$gapchr/ );
return %counts;
}
# Takes a sequence and returns letter => fractional composition pairs as a hash.
sub comp {
my %comp = getcounts( $_[0] );
foreach my $chr (@alphabet) {
$comp{$chr} = $comp{$chr} / ( length( $_[0] ) - $comp{'gap'} );
}
return %comp;
}
# Takes two sequences and returns a measure of the composition difference between them, as a scalar.
# Originally all on one line but it was unreadable.
sub dcomp {
my @dcomp = pairwise { $a - $b } @{ values( %{ comp( $_[0] ) } ) }, @{ values( %{ comp( $_[1] ) } ) };
@dcomp = apply { $_ ** 2 } @dcomp;
my $dcomp = sqrt( sum( 0, @dcomp ) ) / 20;
return $dcomp;
}
Большое спасибо за любые ответы или советы!