В настоящее время я борюсь с проблемой нормализации адреса. В начале ul = street
. В моей стране в большинстве случаев встречаются улицы с форматом "ul. Marii Skłodowskiej-Curie"
без номера в конце улицы, но в конкретной ситуации встречаются улицы типа "ul. Dywizjonu 303", где 303 не является номером дома.
У меня есть адресный словарь, в котором мне нужно проверить, существует ли улица. Первый пример довольно легко проверить, потому что я удаляю все цифры из конца строки и сравниваю результирующую строку со словарем, но с другой стороны, во втором примере, если я удалю все цифры из конца строки, я получу «ul. Dywizjonu» без 303, который нормально интегрирован с улицей.
У меня вопрос: возможно ли избавиться от лишних цифр и символов в конце строки и получить последнюю пару или одну цифру из строки:
Например:
"ul. Warszawska 150 12/45" -> отдельный результат 150 и ul. Варшавская
"ul. Warszawska 17/19" -> отдельный результат 17 и ul. Варшавская
"ul. Lipca 80r. 90" -> отдельный результат 90 и ul. Липка 80р.
"ul. Warszawska 14 10/120 / 2b" -> отдельный результат 14 и ul. Варшавская
В настоящее время я удалил все лишние множественные пробелы из строки и разделил их на пробелы, но я совершенно не знаю, что мне делать дальше, чтобы получить желаемый результат, как описано выше.
Заранее благодарю за помощь.