Матрица расстояний Хэмминга для нескольких последовательностей - PullRequest
0 голосов
/ 01 мая 2019

У меня есть файл FASTA с идентификаторами и соответствующими последовательностями ДНК, которые я проанализировал и сохранил в словаре. Теперь мне нужно написать программу на Python для вычисления попарной матрицы расстояния Хэмминга для ВСЕХ последовательностей.

До сих пор я пытался запустить цикл for для всех значений словаря и проверять каждый символ, но он не реализует должным образом расстояние Хемминга или не возвращает матрицу.

1 Ответ

0 голосов
/ 01 мая 2019

Попробуйте использовать пакет sklearn, он имеет функцию для вычисления попарных расстояний с заданной метрикой расстояния.Вы можете найти эту функцию здесь: https://scikit -learn.org / stable / modules / generate / sklearn.metrics.pairwise_distances.html .

...