Как использовать онтологии - PullRequest
1 голос
/ 30 марта 2012

У меня есть этот вопрос. Я могу понять, что веб-страницы могут интерпретироваться только людьми, а не машинами. Поэтому мы создаем словари и семантику и представляем информацию в формате rdf в формате ориентированного графа, чтобы машины могли ее даже интерпретировать. У нас есть предикат субъекта и объект, где субъекты, предикат и объекты могут быть Uris. Но я сбит с толку, если мы должны иметь rdf-файл, соответствующий каждой странице веб-сайта, чтобы люди могли просматривать веб-страницу, но машины могли использовать версию rdf. Я прав?

Также я видел, что с помощью разработки онтологий мы генерируем правила, используя анализ правил ассоциации. У меня также есть некоторая путаница в этом. Допустим, я хочу создать онтологию для домена, скажем, медицинский. Затем, используя майнинг правил ассоциации, я добываю сайты или другие данные, чтобы получить некоторые ассоциации. Но, делая это, я могу определить только связь между понятиями. Как я могу получить новую концепцию, используя этот майнинг?

Также, как мы можем использовать эти недавно созданные онтологии. Мы должны добавить их на сайт, как? Мне не понятно Так нужны предложения?

1 Ответ

7 голосов
/ 06 апреля 2012

Но я запутался, если мы должны иметь rdf-файл, соответствующий каждой странице веб-сайта, чтобы люди могли видеть веб-страницу для интерпретации человеком, но машины могли использовать версию rdf. Я прав?

RDF - это модель данных, которая, как и реляционная модель, может использоваться для хранения всех видов информации. Его не нужно прикреплять к веб-странице. На самом деле, он может существовать даже независимо от Интернета. Веб-страницы могут встраивать данные RDF непосредственно в код HTML (с помощью RDFa), поэтому вам не обязательно нужны разные представления для людей и машин. Страницы HTML могут быть полностью отделены от данных RDF, но машины могут быть направлены в нужное место по-разному, например, через ссылку в заголовке веб-страниц или с семантической картой сайта .

В кругах связанных данных все должно быть описано с использованием HTTP URI для их идентификации. Когда вы просматриваете URI, вы должны получить описание вещи, и в этом случае считается хорошей практикой предоставлять RDF для программных приложений, которым это требуется, и HTML для пользовательских агентов, взаимодействующих с людьми (таких как веб-браузер) , Например, если вы перейдете на http://dbpedia.org/resource/Lyon с помощью веб-браузера, вы получите this . Если вы перейдете на тот же URI с веб-сканером, вы можете получить , что .

Как я могу получить новую концепцию, используя этот майнинг?

Разработка онтологий и майнинг правил - это разные вещи. Обычно онтологии разрабатываются без майнинга правил. Концепции обычно появляются в результате соглашения между людьми, которые хотят разработать онтологию для определенной цели. Тем не менее, можно догадаться о новых концепциях процесса майнинга, возможно, анализа текста или анализа правил ассоциации. Но это не относится к тому, как использовать онтологии.

Также, как мы можем использовать эти вновь созданные онтологии.

В большинстве случаев вы используете онтологии, просто используя термины онтологий. Например, если вы хотите описать Джима, человека по имени Джеймс Д. Гу. В RDF вы знаете, что идентифицируете вещи с помощью URI, поэтому вам нужен URI для Jim, скажем, http://yourdomain.com/jim, сокращенно yd:jim для краткости (для этого вы должны решить собственную схему URI). Теперь вы хотите сказать, что Джим это человек. Для этого у вас есть специальный предопределенный предикат rdf:type:

 yd:jim  rdf:type  <aClassThatRepresentsPeople> .

Теперь вы можете создать новый собственный URI для <aClassThatRepresentsPeople>, но именно здесь онтологии вступают в игру. Класс людей будет использоваться снова и снова, поэтому вы хотите, чтобы это был термин, который разделяют многие. Чтобы использовать термин онтологии, вы можете просто написать его URI. Вам не нужно ничего особенного, объясняющего, откуда взялся этот термин, ни оператора импорта. Поскольку предполагается, что URI универсальны, ясно, что вы используете тот же термин, что и в онтологии. Более того, если онтология следует передовым методикам связанных данных, URI класса должен быть разыменованным, поэтому при поиске URI с помощью HTTP GET вы получите определение термина. То же самое для имени Джима. Вы хотели бы сказать что-то вроде этого в RDF:

yd:jim  <theNameAttribute>  "James D. Goo" .

Здесь вам не нужен URI для самого имени, которое является просто символьной строкой (хотя можно было бы дать ему такой идентификатор, чтобы вы могли разбить его на имя, отчество, фамилию, так далее). Опять же, для <theNameAttribute> вы просто повторно используете свойство, определенное в онтологии. В итоге у вас может получиться что-то похожее на это:

yd:jim  rdf:type  foaf:Person .
yd:jim  foaf:name  "James D. Goo" .

где foaf: - префикс FOAF Ontology, популярного для описания людей в Интернете.

Как мы должны добавить их на сайт?

Не совсем, но в некоторой степени да. Вы можете повторно использовать существующую онтологию (например, FOAF), которая находится на совершенно другом веб-сайте. В этом прелесть Интернета и связанных данных: он распределен и модульный. Но если вы используете свою собственную онтологию (скажем, http://yourdomain.com/ontology), вы должны сделать эту онтологию доступной посредством разыменования, то есть, если вы посмотрите условия онтологии (например, http://yourdomain.com/ontology#person), ваш сервер должен ответить с описанием онтология или, по крайней мере, запрошенного термина. Вы просто добавляете онтологию так, как если бы вы добавляли любой файл на ваш сайт.

...