У меня много небольших текстов (скажем, около 500 слов) и две базы данных с примерно 10.000 записей в каждой (ключевые слова).
Теперь я хочу обработать каждый текст и выяснить, какие ключевые слова (те, которые сохранены в 2 базах данных) содержатся в тексте.
У кого-нибудь из вас есть хороший подход к тому, как сделать это эффективно?
Я хотел обработать каждый текст и проиндексировать его (возможно, с помощью lucene) перед поиском в базе данных по нему, но я не знаю, подходит ли lucene для этого.