Разница между подходом индекса k-граммы и стандартными python строковыми методами в обработке запроса wildCard - PullRequest
0 голосов
/ 09 февраля 2020

Чем отличается метод k-граммы при обработке запроса wildCard (из того, что я читал в Интернете, почти каждый институт использует этот метод)?

Я знаю, что для биграммы вы разбиваете слово на би- последовательности символов, например, mon* становятся $m, mo, on (конечно, вам нужно поддерживать вторичные индексные проводки), и вы И эти последовательности, которые будут возвращать пересечения слов, которые удовлетворяют условию AND.

Но разве не просто python string.startswith(str), который также проверяет, работает ли термин, начинающийся с str, проще (или, возможно, лучше), чем метод k-граммы?

Должен ли я использовать string.startswith(str) ради простоты?
Любая помощь приветствуется.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...