Со временем я создаю сайт на трех языках: английском, русском и китайском. Я надеюсь, что если я использую UTF-8 в приложении и базе данных, не будет никаких проблем с вводом-выводом (будет ли?)
Но самая пугающая часть этого - поиск. Это должно быть достаточно круто. Он должен быть полнотекстовым, должен индексироваться и т. Д. Я надеюсь, что он поймет морфологию, будет использовать основы и т. Д.
Сначала я посмотрел Zend_Search_Lucene, но, как я понял из http://framework.zend.com/issues/browse/ZF/component/10021, у него проблемы с китайским языком. (
Теперь я думаю о Сфинксе. Он поддерживает как английский, так и русский языки. Я не уверен, насколько хорошо с китайцами, и я понятия не имею, насколько трудно будет добавить поддержку для него. http://www.sphinxsearch.com/forum/view.html?id=1554 - это серебряная подкладка, но, как неопытный пользователь Sphinx, я не думаю, что понимаю, что там сказано.
Итак,
Кто-нибудь имеет опыт такого «независимого от языка» поиска и может поделиться им со мной, пожалуйста?
и не могли бы вы дать мне что-нибудь для проверки поиска. Как носитель русского языка, обладающий некоторыми базовыми знаниями английского языка, я могу самостоятельно проверять и русский, и английский поиск, но я даже не знаю, какие части этого китайского фото являются словами. Пожалуйста, дайте мне несколько китайских строк, чтобы поместить их в индекс, и несколько запросов с ожидаемыми результатами!