Я хочу создать алгоритм, который может видеть, записан ли адрес в предложении.
Например, если пользователь пишет:
"Привет, мой адрес - Линкольнстрит 27, Foobarcity. Ты можешь забрать посылку?"
А адрес пользователя - Lincolnstreet 27, Foobarcity , тогда я хочу алгоритм, который может обнаружить, что адрес был упомянут в предложении.
Я уже знаю название и номер улицы пользователя, почтовый индекс и название города.
Это также должно быть нечетким, поскольку люди могут делать опечатки или вносить небольшие изменения в свой адрес, который они написали в предложении. Однако не обязательно, чтобы алгоритм отлавливал все события всегда, независимо от их опечатки, поскольку это, очевидно, невозможно. Это нормально с полунаивным решением.
Я посмотрел вдаль Левенштейна, но не могу понять, как заставить это работать для этого точного сценария. Я также изучил Longest Common Subsequence, и там та же проблема.
Есть идеи? Мне не обязательно заботиться о языке программирования.
Меня не интересует решение нейронной сети - я искренне верю, что его можно решить с помощью относительно наивного алгоритма - я просто не знаю, с чего начать.