У меня есть сценарий использования, когда мне нужно извлечь название недвижимости, город и штат (если оно доступно) в заголовке новостей и сравнить с записями в базе данных. Я могу извлечь сущности из заголовков новостей, используя статистическую модель НЛП с открытым исходным кодом в Python, но сталкиваюсь с проблемой при сопоставлении названия города и названия города записи в БД.
Например, сопоставление извлеченного названия города "N York" из заголовка новости со строкой базы данных с названием города "New York".
Я пробовал несколько библиотек Python, таких как Fuzzy Wuzzy, расстояние Левенштейна, функция подобия Spacy, но, похоже, не подходит для моего варианта использования.
Мне нужно несколько указаний о том, как добиться совпадения названий городов и генерировать относительный счет совпадений.