Я использую сервис SphinxSearch для создания поискового индекса, и он прекрасно работает ... очень быстро с релевантными результатами!
Теперь мы хотим найти инструмент автопредставления opur и хотели бы добывать популярные ключевые слова из нашей БД...
indexer --buildstops прекрасно работает для нас ... с параметрами --buildfreqs почти идеально ...
, но ему не хватает двух вещей ...
- слова в простой английской кодировке, без специальных символов utf8, которые есть в нашей БД (например, ščž)
Как я могу получить правильные слова?какие-либо предложения?
- Он получает только ключевые слова, но не фразы ... мы хотели бы также популярные фразы, содержащие не более 3 слов ....
есть ли альтернатива, быстрый способ заминировать таблицу БД для этих фраз?Мы используем PHP / MySQL комбо