Обоснование полнотекстовых стоп-слов MySQL - PullRequest
7 голосов
/ 23 февраля 2010

В настоящее время я пытаюсь разработать базовый полнотекстовый поиск для своего веб-сайта, и я заметил, что некоторые слова, такие как «относительно», указаны в качестве стоп-слов для полнотекстового поиска MySQL. Это не беспокоит меня сейчас, так как люди, ищущие данную новость, не обязательно будут искать, используя слово «относительно» (но я, конечно, не могу говорить за всех!). Тем не менее, я надеялся, что кто-то здесь сможет объяснить мне обоснование наличия списка стоп-слов. Спасибо! * * 1001

Для уточнения: Я использую MyIsam для моей полнотекстовой таблицы. Стоп-слова - это слова, которые MySQL не будет индексировать (для любого полнотекстового индекса). Как отмечается в комментарии к этому вопросу, существует полный список стоп-слов без каких-либо объяснений. Я просто хотел бы знать, есть ли обоснование для слов "они" выбрали.

1 Ответ

8 голосов
/ 23 февраля 2010

Стоп-слова - это обычные слова в английском языке. В большинстве случаев ваши результаты поиска будут более релевантными - и ваши индексы будут меньше и быстрее - если вы не индексируете эти слова.

Вы можете отредактировать список стоп-слов, используя переменную ft_stopword_file (или установить для нее значение '', чтобы индексировать все слова длиной или длиннее, чем ft_min_word_len), если это лучше соответствует вашим потребностям. Вы также можете изменить минимальную длину индексированного слова, используя переменную ft_min_word_len, которая существует по той же причине.

...