С тех пор как появились большие веб-приложения, поиск данных (и молниеносный и точный поиск) стал одной из самых важных проблем в веб-приложениях. Некоторое время я работал с Lucene.NET , который является портом C # проекта Lucene .
Я также работаю с использованием PHP, используя Lucene API Zend Framework , что подводит меня к моему вопросу. В большинстве случаев для обеспечения хорошей индексации нам необходимо использовать некоторые инструменты НЛП, такие как tokenizing , lemmatizing , и многие другие вопросы:
Знаете ли вы о какой-либо хорошей среде программирования / наборе инструментов НЛП, использующей PHP?
PS: я хорошо знаком с Zend API для Lucene, но правильная индексация данных - это не просто хранение и использование в Lucene, вам необходимо выполнить некоторые дополнительные задачи, подобные указанным выше.