Разбор строки поиска по нескольким терминам в спецификации запроса? - PullRequest
1 голос
/ 26 августа 2011

Я работаю над веб-сервисом, который позволяет пользователям искать встречи с предприятиями, содержащимися в нашем индексе. Мы намерены создать интеллектуальную поисковую систему, которая будет обрабатывать несколько типов терминов. Основная цель состоит в том, чтобы разбить строку, например, «область ночного залива следующей недели стоматолога» или ее подмножества, на 4 категории: тип обслуживания, диапазон дат, диапазон времени и местоположение. Затем мы можем использовать эти категории для создания запроса к нашей базе данных.

Я убежден в том, что покупаю против строительства, но у меня были проблемы с поиском любых продуктов, которые предлагают эту возможность. Это функция, которую большинство компаний разрабатывают собственными силами? Спасибо за любой совет.

1 Ответ

1 голос
/ 26 августа 2011

Вы говорите о семантическом анализе, это широкая тема

Существует инструментарий Python nltk , который может выполнять категоризацию текста.

Классификатор может быть более подходящим

...