Как используется RDFa? - PullRequest
3 голосов
/ 10 июня 2011

Мне было интересно, как используется RDFa. Более конкретно, если семантическая сеть данных состоит из троек в RDF, то как потребитель контента RDFa использует эти данные? Должен ли он быть преобразован с помощью такого инструмента, как GRDDL? Или есть другие способы получения семантических данных с сайтов RDFa?

Спасибо, Bruce

Ответы [ 3 ]

3 голосов
/ 10 июня 2011

Один из способов - использовать синтаксический анализатор RDFa для извлечения троек из документа RDFa, а затем обработать их в своем приложении.Я думаю, это то, что Google и компания делают в своих поисковых системах.

В качестве альтернативы вы можете указать хранилищу SPARQL (либо в памяти, либо в постоянном хранилище) загрузить документ с помощью его API или команды LOAD SPARQL 1.1, а затем использовать запросы SPARQL для доступа к данным.Это также позволит вам запрашивать сразу несколько документов.

Я бы, вероятно, не советовал пытаться обрабатывать тройки напрямую, если ваше приложение или данные не очень просты.

0 голосов
/ 10 июня 2011

RDF - это не что иное, как граф, соединяющий узлы (обычно ресурсы) с другими узлами (другими ресурсами или литералами) через именованные ребра, но с изюминкой.Края могут быть выведены с помощью логики, что означает, что вы можете получить ответы на вопросы, даже если вы никогда не предоставили дословный ответ.Механизм логического вывода достаточно умен, чтобы получить эти ответы из того, что он знает о системе, и что он знает о логике того, что он описывает.Пример: если вы укажете, что A является матерью B, механизм вывода может сделать вывод, что у B есть родительский объект A. Вы никогда не указывали ребро, соединяющее B -- hasParent -> A, но вы указали A -- motherOf -> B, а также указали hasParent и motherOf являются обратными.

Когда у вас есть данные, вы можете задавать вопросы в базу данных / механизм вывода.Эта операция в основном является поиском изоморфизма подграфа.Ваш запрос представляет собой граф, а ваша база данных содержит огромный граф со всеми ресурсами, связанными именованными ребрами.Задача базы данных состоит в том, чтобы найти те части огромного графа, которые соответствуют (являются изоморфными) вашему запросу, учитывая также особенности каждого ребра и узла, а не только их взаимосвязь.

Для чего он используется?много вещей.Вы можете делать очень мощные вещи с этой моделью данных.Один из тривиальных понятий - это думать в социальных сетях: люди (ресурс, узел графа) связаны отношениями (friendOf) и описываются (isAged, lifeIn).С помощью запроса вы можете найти всех людей в возрасте 23 лет, имеющих по крайней мере трех подруг и проживающих в Париже.

0 голосов
/ 10 июня 2011

Существует множество способов доступа к данным RDF. Такие сайты, как, например, dbpedia, имеют конечную точку sparql, поэтому вы напрямую запрашиваете тройки на языке базы данных. Это довольно удобно.

Иногда вы также можете напрямую получить rdf-файл и проанализировать его с помощью таких фреймворков, как Jena (Java).

...