У меня есть контент новостной статьи, который индексируется с помощью Lucene и опрашивается с помощью Zend_Lucene в PHP.
Контент часто ссылается на телевизионные каналы Великобритании (например, BBC One), но я знаю, что наши пользователи частовведите поисковый термин «BBC 1» или «BBC1», а не «BBC One».
Существует ли какой-либо «стандартный» подход к поиску «цифры как слова» и «цифры как цифры»?Проблема?
Кажется, я выбираю либо изменить поисковый запрос, когда я вижу цифры, например, я меняю условия поиска "BBC1" на "BBC 1 One" (или что-то подобное) - илиЯ изменяю индексированный контент, чтобы цифры преобразовывались в слова и наоборот, и обе версии сохранялись в индексе.