Чтобы идеальное совпадение нечетких строк, важно знать о контексте строк. Когда речь идет о небольших опечатках, Левенштейн может быть достаточно хорош. Когда речь идет о неслышном звуке, вы можете использовать фонетический алгоритм, такой как soundex или metaphone.
В большинстве случаев вам нужна комбинация следующих алгоритмов и некоторые более конкретные написанные вручную вещи.
- Иглман-Вунш
- Soundex
- Metaphone
- Расстояние Левенштейна
- Растровое изображение
- Расстояние Хэмминга
Не существует лучшего алгоритма нечеткого сопоставления строк. Все дело в контексте, в котором он используется, поэтому вам нужно сообщить нам, где вы хотите использовать сопоставление строк.