От интеллектуального анализа данных до RDF - PullRequest
0 голосов
/ 02 октября 2018

Я изучал Apache Jena, и они довольно просты.У меня вопрос, если я занимаюсь анализом данных на примере текста: для каждого абзаца в учебнике я получаю имена, места, ключевые фразы и т. Д. ... Какой самый простой способ преобразовать их в rdf с помощью онтологии?

1 Ответ

0 голосов
/ 03 октября 2018

Предполагая, что ваши сущности уже извлечены из текста в виде строк (например,,,и т. д.), вы можете просто использовать ModelFactory в Jena для создания модели, а затем заполнить ее ресурсами, используя model.createResource(uri), и свойствами ресурса, используя .addProperty(), как можно найти в примерах и документации Jena.В этих примерах также показано, как распечатать модель в RDF (итерируя по операторам и используя stmt.getSubject(), stmt.getPredicate() и stmt.getObject(). Что касается онтологии, вы можете придумать свою собственную или, что более предпочтительно, использовать существующуюсловарь. Предположим, например, что вы решили использовать класс Person из schema.org. Затем вам нужно указать rdf:type вашего ресурса равным https://schema.org/Person. Аналогично, вы можете использовать свойства из этого словаря, такие какhttps://schema.org/name, который наследуется от https://schema.org/Thing (как все можно найти в schema.org docs ). Вам не обязательно, чтобы ваша онтология присутствовала в вашей модели или базе данных, пока вы структурируете свои экземплярыправильно с URI, идентифицирующими классы и свойства из словарей или онтологий, которые вы используете. Если у вас есть программные потребности, вы можете иметь словарь в вашей модели, но тогда я думаю, что вам следует взглянуть на Документы Jena по онтологии ).

...