Я недавно внедрил алгоритм Левенштейна в нашу базу данных поисковой системы, но мы столкнулись с проблемой.
По основному левенштейну
Левенштейн («123456», «12x456») совпадает со значением Левенштейна («123456», «12345x»)
Обычно это нормально, но для моей конкретной проблемы это неправильно. Когда кто-то использует наш сайт, это неправильно. Производители электронных компонентов часто производят аналогичные продукты, только с разницей в самом последнем письме. Если первая буква отличается, это обычно совершенно другая категория. Поэтому мне нужен алгоритм, который считает совпадения в начале слова более ценными, чем те, что в спине, или, другими словами, несоответствия, которые происходят в начале, должны применять большее наказание, чем в конце.
Если у кого-нибудь есть идеи, пожалуйста, дайте мне знать.