Для задачи, над которой я работаю, для нахождения расстояний между двумя последовательностями, чтобы определить их сходство, порядок последовательности очень важен.Тем не менее, все мои последовательности имеют разную длину, поэтому я дополняю любые недостающие строки пустыми точками, чтобы обе последовательности имели одинаковую длину, чтобы удовлетворить требование расстояния Хэмминга.Есть ли какая-то серьезная проблема, связанная со мной, поскольку все, что меня волнует, это количество транспозиций (а не вставок или удалений, как делает Левенштейн)?
Я обнаружил, что расстояние Хэмминга намного, намного быстрее, чем Левенштейнв качестве метрики расстояния для последовательностей большей длины.Когда следует использовать расстояние Левенштейна (или производные расстояния Левенштейна) вместо гораздо более дешевого расстояния Хэмминга?Расстояние Хемминга можно рассматривать как верхнюю границу для возможных расстояний Левенштейна между двумя последовательностями, поэтому, если я сравниваю две последовательности по метрике подобия, смещенной по порядку, а не по абсолютному минимальному количеству ходов, чтобы соответствовать последовательностям, очевидногопричина для меня, чтобы выбрать Левенштейна вместо Хемминга в качестве метрики, есть?