Соответствие строки поисковой системы - PullRequest
0 голосов
/ 26 января 2012

Какой типичный алгоритм используется поисковыми системами в Интернете для составления предложений для слов с ошибками. Я не обязательно говорю о Google, но о любом сайте с функцией поиска, например, Amazon.com. Скажем, я ищу слово "shoo"; сайт вернется и скажет "did you mean: shoe".

Является ли это некоторым изменением алгоритма расстояния Левенштейна ? Возможно, если они используют какую-то систему полнотекстового поиска (например, lucene), это встроено? Может быть, полностью на заказ?

Я знаю, что ответ сильно варьируется, я просто ищу указание, как начать работу с этим (в корпоративной среде).

...