Мне нужно геолокации серии записей в базе данных проектов развития одной страны. У меня есть краткий обзор каждого проекта, в рамках которого я хотел бы определить муниципалитеты (или даже более крупные политические структуры), чтобы позднее я мог геолокации каждого проекта с помощью API GoogleMaps.
Я пытаюсь извлечь географическую информацию без использования обработки естественного языка. Я не заинтересован в использовании НЛП, потому что проект находится в небольших деревнях, чье имя я могу получить из других источников.
Я подумывал разбить текст на пробелы и попытаться найти совпадения, используя словарь Python, в котором значение - это название деревни, а ключ - это название деревни, разбитой на пробелы.
Пример:
«Проект Х был построен в Гааге, Нидерланды».
Дали бы мне: "Гаага"