Как я могу реализовать семантическую онтологию в Ruby on Rails? - PullRequest
1 голос
/ 25 февраля 2009

Я работаю над «твиттер-фильтром» - больше изучаю ruby ​​на рельсах, чем что-либо еще. Идея состоит в том, что я использую семантическую онтологию для поиска интересов пользователей. Так что, если пользователь говорит, что он заинтересован в «спорте», это означает, что помечать любые твиты, в которых обсуждаются «спорт», «гольф», «футбол» и т.

Хотелось бы, чтобы я мог расширить его до любых иракских тем. Поэтому, если вы заинтересованы в Европе, отметьте все страны Европы.

Естественно, это довольно сложно, поэтому, возможно, мы бы ограничили его одним или двумя "уровнями" поиска ...

Как я мог сделать это эффективно? Я довольно хорошо знаком с Java, C и Ruby и много работал с MySQL.

Ответы [ 4 ]

2 голосов
/ 25 февраля 2009

Я бы посмотрел на Дуга Лената Цикл . Это сделано и открыто.

0 голосов
/ 13 мая 2009

Я не уверен, каковы ваши требования. Но, похоже, вам подойдет либо Разложение по сингулярному значению (SVD), либо Машины опорных векторов (SVM).

0 голосов
/ 13 марта 2009

Прежде чем думать о языках программирования и технологиях, подумайте над этим: Какая структура данных является "семантической онтологией"?

Для меня это звучит как какой-то направленный граф .

Зная это, вы скоро обнаружите, что такую ​​структуру довольно легко реализовать на любом языке и технологии, которые вы хотите, и что многие языки уже реализовали какую-то библиотеку графов (например, RGL). для Ruby).

Для меня реальная проблема не в том, как реализовать такую ​​структуру данных и как сделать это эффективно, а в том, как получить семантическую информацию, которая вам нужна, из твиттера (например, кто говорит вашему приложению, что Европа часть Испании, но эта Испания является частью Европы?).

В любом случае, получайте удовольствие от реализации, звучит как крутой проект! : -)

0 голосов
/ 25 февраля 2009

Я не уверен, поможет ли это вам, но в Google есть нечто, называемое Google Sets. Вы можете посмотреть на это здесь: http://labs.google.com/sets

...