Я ищу способ найти наиболее близкое совпадение строк между двумя строками, которые в конечном итоге могут иметь очень разные размеры.Допустим, у меня есть, с одной стороны, список возможных мест, таких как:
Йосемитский национальный парк
Йосемитская долина
Йосемитский национальный парк Lodge
Центр посетителей национального парка Йосемити
Сан-Франциско
Парк Золотых Ворот Сан-Франциско
Париж
Нью-Йорк
Манхэттен НовыйЙорк
Гонконг
С другой стороны, у меня есть несколько предложений типа:
- "Я предложил своей жене 12 ноября 1984 года, во время безумного ливня в центре Йосемити в Калифорнии "
- " Я люблю гулять со своей собакой в Центральном парке, Нью-Йорк "
- " Я люблю Гонконг "
Теперь скажите, что я хотел бы извлечь местоположение из этого набора предложений, я бы продолжил это делать?Я знаю об алгоритме расстояния Левенштейна , но я не совсем уверен, что он будет работать эффективно здесь, особенно потому, что у меня есть еще много мест и еще много предложений, которые можно попробовать.Я предполагаю, что мне хотелось бы получить какой-то соответствующий счет для каждого местоположения, чтобы я мог выбрать тот, у которого был самый высокий балл, но я не знаю, как вычислить этот счет.
ребята есть идеи как это сделать?Или, может быть, даже реализация или пакет Python?
Заранее спасибо