Какой типичный алгоритм используется поисковыми системами в Интернете для составления предложений для слов с ошибками. Я не обязательно говорю о Google, но о любом сайте с функцией поиска, например, Amazon.com. Скажем, я ищу слово "shoo"
; сайт вернется и скажет "did you mean: shoe"
.
Является ли это некоторым изменением алгоритма расстояния Левенштейна ? Возможно, если они используют какую-то систему полнотекстового поиска (например, lucene), это встроено? Может быть, полностью на заказ?
Я знаю, что ответ сильно варьируется, я просто ищу указание, как начать работу с этим (в корпоративной среде).