У меня есть имена всех сотрудников моей компании (5000+).Я хочу написать движок, который может на лету найти имена в онлайн-статьях (блоги / вики / справочные документы) и пометить их тегом "mailto" с электронной почтой пользователей.
На данный момент я планируюудалите все стоп-слова из статьи, а затем найдите каждое слово в индексе люцены.Но даже в этом случае я вижу много запросов, попадающих в индексы, например, если есть статья с 2000 словами и только двумя ссылками на имена людей, то, скорее всего, будет 1000 запросов lucene.
Есть лиспособ уменьшить эти запросы?Или совершенно другой способ достижения того же самого?Заранее спасибо