Семантический поиск в Python для хобби + последние новости - PullRequest
15 голосов
/ 11 января 2012

Я хочу реализовать основанный на Python семантический поиск по набору ключевых слов (в основном хобби, последние новости и т. Д., О которых людям может быть интересно поговорить). Я хочу знать, существуют ли базы данных онтологий для того же самого и алгоритмы / реализации поиска с открытым исходным кодом для того же самого.

Например. Мой набор = {говорить, пить, писать в Твиттере, Катрина Кайф, Циклон Катрины, коллекционирование камней, коллекционирование монет}

Таким образом, при поиске «накапливать» я мог бы получить коллекцию камней и монет в качестве результата.

Редактировать: Термины могут иметь несколько слов. То есть «Президент. Барак Обама, США» - это правильный запрос.

Ответы [ 2 ]

4 голосов
/ 16 января 2012

Возможно, вы захотите использовать «случайную индексацию». Он может делать именно то, что вам нужно, он вычисляет вектор признаков для каждого слова и определяет показатель семантического сходства между двумя словами.

Все, что вам нужно, - это получить копию Введение в случайную индексацию и семантические векторы , чтобы начать работу ...

Надеюсь, это поможет, если вам нужны дополнительные советы, пожалуйста, прокомментируйте ...

1 голос
/ 21 января 2012

Надеюсь, но не уверен, полезно ли это вам.

Gnowsys

  • все еще в тяжелом развитии
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...