Как лучше всего анализировать большие тексты (5000 слов и более), искать имена, которые хранятся в базе данных? Тексты будут многоязычными.
Моя первая идея - довольно наивный подход, когда все слова начинаются с большой буквы и сравниваются с базой данных. Но это обычно приводит к сбою в текстах, содержащих только строчные буквы.
Редактировать
Тексты не статичны, а динамичны (например, веб-сайты)
Лучший
Macs