Я пишу программу, которая должна вычислить множественное выравнивание последовательностей набора строк. Я думал об этом в Python, но я мог бы использовать внешнюю часть программного обеспечения или другой язык, если это более практично. Данные не особо большие, у меня нет строгих требований к производительности, и я могу терпеть приближения (т.е. мне просто нужно найти достаточно хорошее выравнивание). Единственная проблема заключается в том, что строки являются обычными строками (т. Е. Строки UTF-8 потенциально с символами новой строки, которые следует рассматривать как обычный символ); они не являются последовательностями ДНК или белковыми последовательностями.
Я могу найти тонны инструментов и информации для обычных случаев в биоинформатике со специфическими сложными форматами файлов и множеством функций, которые мне не нужны, но найти программное обеспечение, библиотеки или примеры кода для простого случая, безусловно, трудно струн. Я мог бы, вероятно, переопределить любой из многих алгоритмов для этой проблемы или закодировать мою строку как ДНК, но должен быть лучший способ. Знаете ли вы какие-либо решения?
Спасибо!