Чем отличается метод k-граммы при обработке запроса wildCard (из того, что я читал в Интернете, почти каждый институт использует этот метод)?
Я знаю, что для биграммы вы разбиваете слово на би- последовательности символов, например, mon*
становятся $m
, mo
, on
(конечно, вам нужно поддерживать вторичные индексные проводки), и вы И эти последовательности, которые будут возвращать пересечения слов, которые удовлетворяют условию AND.
Но разве не просто python string.startswith(str)
, который также проверяет, работает ли термин, начинающийся с str
, проще (или, возможно, лучше), чем метод k-граммы?
Должен ли я использовать string.startswith(str)
ради простоты?
Любая помощь приветствуется.