Я пытаюсь закодировать парсер естественного языка и поисковую систему на PHP. Все способы, о которых я до сих пор думал, были либо обременительны для реализации, использования, либо не настолько эффективны.
Одной из моих идей был сценарий, который выполнял бы регулярное выражение для упрощенной строки, т.е. различные слова удаляются из строки, а затем полученная строка проверяется сначала на предмет того, что ищет пользователь - т. е. «время открытия», затем, если возможно, место, которое они ищут - скажем, «Derngate». Остальное похоже на это.
Может кто-нибудь направить меня в сторону более эффективного способа ведения дел? Я не хочу делать 25 различных регулярных выражений - или сколько бы это ни было - для каждой загрузки страницы, если я могу помочь.
Большое спасибо!
Редактировать: Мне просто любопытно, вот и все. Я предпочел бы сделать свой собственный (чтобы посмотреть, как это работает), чем прыгать в нечто вроде Lucene.