Мне поручено работать над приложением для индексации текста произвольной формы для быстрого поиска.Я уверен, что это область, которая была исследована до смерти.Однако я не уверен, с чего начать, любая помощь очень ценится.
Посмотрите вверх Инвертированный индекс . По ссылке есть несколько реализаций.
Есть даже инструмент с открытым исходным кодом, который хорошо ценится.http://lucene.apache.org/java/docs/index.html