Поиск предложения в большом тексте предложения корпус - PullRequest
0 голосов
/ 26 мая 2018

Я новичок, и я хочу знать, есть ли способ поиска текстового предложения в большой текстовой последовательности данных (скажем, 1 миллион) и поиска соответственно, как при вводе пользователем:

Я не должен быть там

тогда он должен искать следующую последовательность:

Я не должен быть там

похож на это:

Я пойду туда.

до

Я пойду туда.

IПодумал пару дней, чтобы найти решение этой проблемы.

Если вы знаете что-нибудь о том, как решить эту проблему, пожалуйста, предоставьте решение, или просто подсказки будет более чем достаточно.Спасибо.

1 Ответ

0 голосов
/ 26 мая 2018

Сначала я бы прошел через предложение и текст и заменил все сокращения длинной формой.Затем после этого используйте Кнут-Моррис-Пратт.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...