Как бы вы проанализировали строку текста произвольной формы для обнаружения таких вещей, как местоположения и имена, на основе словаря местоположений и имен?В моем конкретном приложении будет несколько десятков тысяч, если не больше записей в моих словарях, так что я уверен, что просто просмотреть их все не может быть и речи.Кроме того, есть ли способ добавить «нечеткое» сопоставление, чтобы вы могли также обнаружить подстроки, которые находятся в пределах x
правок словарного слова?Если я не ошибаюсь, это относится к области обработки естественного языка и, в частности, к распознаванию сущностей (NER);однако моя попытка найти информацию об алгоритмах и процессах, лежащих в основе NER, оказалась пустой.Я бы предпочел использовать Python для этого, так как я лучше с этим знаком, хотя я открыт для поиска других решений.