Я работаю над одной из проблем обработки естественного языка, используя Python .
Моя проблема:
Давайте рассмотрим строку
str1 = "United, State is a very nice country"
Мы предварительно обработали эту строку, где мы удалили все специальные символы, URL-адреса, содержимое HTML и т. Д. Теперь предварительно обработанная строка станет примерно такой:
preprocessed_str = "United State is a very nice country"
Затем мы передаем эту предварительно обработанную строку в мою модель машинного обучения, которая возвращает результаты, такие как:
Country: United State
Теперь я хочу взять начальный и конечный индекс «United State» в исходной строке.
Мы пытались это сделать с помощью функции python str.find () , но она возвращает -1.
Я буду признателен за подходы и решения, с помощью которых мы можем решить эту проблему. Заранее спасибо:)