Нужно думать как компьютер ... для нас совершенно очевидно, что слово «икс-мужчины» более важно, чем «2», но для компьютера они оба равны.
Вы всегда можете указать sphinx индексировать «x-men 1», «x-men 2» и «x-men 3» к одному и тому же индексу, используя словоформы
x-men 1 > xmen
x-men 2 > xmen
x-men 3 > xmen
поэтому, если кто-то ищет "x-men 2", он увидит результаты для 3 фильмов. Или вы можете указать sphinx не индексировать отдельные числа или установить длину min для индексов .
Но тогда пользователи могут жаловаться на то, что они хотят видеть ТОЛЬКО информацию "x-men 2", а не другие фильмы.
По моему мнению, при настройке поисковой системы вам не нужно угадывать того, что пользователь хочет получить в результате, потому что разные пользователи будут ожидать разных результатов, но вы всегда должны давать ему инструменты для уточнить его поиск. Например, один человек может ожидать, что x-men 2
вернет все фильмы о людях икс, другой - что он вернет информацию, относящуюся только к людям икс-2, и (почему нет?) Кто-то ожидает, что он вернет все фильмы, содержащие слова "люди икс" и "2" ... вы не можете сделать всех счастливыми = P
Удачи