Мне нужно разработать приложение, которое будет индексировать несколько текстов, и мне нужно искать имена людей внутри этих текстов. Проблема в том, что, хотя правильное имя человека - «Грегори Джексон-младший», внутри текста это имя может быть написано как:
- Грег Джексон-младший
- Гегори Джексон-младший
- Грегори Джексон
- Грегори Дж. Джуниор
Я планирую индексировать тексты по ночам и составлять индекс базы данных, чтобы ускорить поиск. Я хотел бы получить рекомендацию для хороших книг и / или хороших статей на эту тему.
Спасибо