Индекс подстроки в исходном тексте - PullRequest
0 голосов
/ 05 сентября 2018

Я работаю над одной из проблем обработки естественного языка, используя Python .

Моя проблема: Давайте рассмотрим строку

str1 = "United, State is a very nice country"

Мы предварительно обработали эту строку, где мы удалили все специальные символы, URL-адреса, содержимое HTML и т. Д. Теперь предварительно обработанная строка станет примерно такой:

preprocessed_str = "United State is a very nice country"

Затем мы передаем эту предварительно обработанную строку в мою модель машинного обучения, которая возвращает результаты, такие как:

Country: United State

Теперь я хочу взять начальный и конечный индекс «United State» в исходной строке.

Мы пытались это сделать с помощью функции python str.find () , но она возвращает -1.

Я буду признателен за подходы и решения, с помощью которых мы можем решить эту проблему. Заранее спасибо:)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...