Текстовый поиск вопрос о реализации - PullRequest
1 голос
/ 22 июля 2010

Может кто-нибудь объяснить мне, как работает алгоритм поиска текста? Я понимаю, что это огромная область, но я пытаюсь понять это с высокого уровня, чтобы я мог посмотреть научные статьи по этому вопросу. Например, орфографические ошибки - одна из проблем, которую сложно решить, и, конечно, Google решает ее. Когда я ищу термин и неправильно пишу его в Google, он автоматически предлагает правильное написание. Как для этого делается индексация? Используя MapReduce, я вижу, что они индексируют различные объекты. Что они или кто-то еще индексируют и хранят? Может быть, я ищу практическую реализацию MapReduce, если я вообще думаю в правильном направлении.

  • Pav

1 Ответ

0 голосов
/ 25 мая 2011

Боюсь, этот вопрос действительно слишком велик, что, вероятно, объясняет, почему он еще не видел ответа.Что касается проверки орфографии Google, Питер Норвиг объясняет, как это делается: Как написать корректор орфографии

Точная реализация в продуктивном использовании в Google, безусловно, выглядит несколько иначеи намного сложнее, но это может помочь вам начать.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...