Рамки для семантической аннотации для определяемой пользователем модели домена - PullRequest
1 голос
/ 08 ноября 2011

У меня есть несколько документов и онтология для некоторых понятий.Существуют ли какие-либо структуры, которые автоматически извлекают эти понятия из данных документов и создают тройки?Онтология должна содержать специальные свойства?

Я нашел UIMA, но насколько я понял с UIMA, я могу сделать только что-то вроде этого:

  • создать несколько словарей, которые будут поддерживать ассоциации с онтологией
  • используйте этот словарь с ConceptMapper
  • напишите потребителя CAS, который создает тройки и сохраняет их -

Мне не нравится этот подход, потому что я должен синхронизировать концепции изонтология и словарь.

Может ли UIMA использоваться по-разному, или существуют ли какие-либо расширенные платформы, которые могут напрямую использовать мою онтологию, например, для ввода некоторых пользовательских свойств в качестве входных данных и на основе этого для аннотирования документов?* Я хочу использовать онтологии в качестве модели предметной области, потому что я хочу в дальнейшем создать базу знаний, и онтологии кажутся более гибкими, чем, например, реляционная модель.Спасибо.

1 Ответ

0 голосов
/ 09 ноября 2011

Потратив больше времени на поиск в Google, я нашел GATE , а точнее OntoRoot Gazetter и Large KB Gazetteer .

OntoRoot Gazetteer - это тип динамически создаваемого справочника, который в сочетании с несколькими другими общими ресурсами GATE способен создавать аннотации на основе онтологий для данного контента в отношении данной онтологии.Этот справочник является частью плагина «Gazetteer_Ontology_Based», который был разработан в рамках проекта TAO.

Я не проверял их, но они, кажется, являются подходящими кандидатами для решения моей проблемы.

...