Какая работа была проделана, чтобы определить, относится ли конкретная строка к географическому местоположению? Например:
'troy, ny'
'austin, texas'
'hotels in las vegas, nv'
Полагаю, я ожидаю статистического подхода, который дает определенную степень уверенности в том, что первые два являются местоположениями. Последнее, вероятно, потребует эвристики, которая захватывает «% s,% s», а затем использует ту же технику. Я специально ищу подходы, которые не слишком сильно зависят от предложения «в», потому что это не совсем однозначный или постоянно доступный индикатор местоположения.
Может ли кто-нибудь указать мне подходы, документы или существующие утилиты? Спасибо!