Я хочу запустить что-то вроде алгоритма BLAST для запроса большой базы данных строк Unicode. Большая часть программного обеспечения для выравнивания, такого как BLAST, ожидает ввод нуклеотидных или белковых последовательностей. Но мой вход мог потенциально содержать любой символ Юникода. Кто-нибудь знает о программном обеспечении, которое позволит мне сделать это? Матрица оценки может быть просто единичной матрицей (без частичного совпадения).
Я пробовал Нидлмана-Вунша и Смита Уотермана, но для моих целей они слишком медленные. Мне нужно запросить большую базу данных, как в BLAST.
Спасибо!