Короткий ответ: любой может просто написать набор аксиом RDFS или OWL в файле и начать использовать его в своем приложении. Существует низкий барьер для создания нового словаря или онтологии, но есть некоторые руководящие принципы.
Для фактического создания файла, содержащего аксиомы (т.е. декларации, если вам удобнее использовать эту терминологию), я лично просто пишу в более компактном формате Turtle с помощью текстового редактора. Я считаю, что это хорошо работает с системами контроля исходного кода и подходит для моего способа работы. Есть редакторы, если вы хотите более визуальный интерфейс, с инструментами, которые помогут обеспечить правильность и последовательность того, что вы делаете. Обычно используются онтологические редакторы TopBraid Composer и Protege , но есть и много других. Если вы работаете в Turtle, но хотите опубликовать как RDF / XML или другой формат, Jena имеет инструмент командной строки для преобразования файлов RDF между различными форматами.
Когда дело доходит до публикации вашего словарного файла, чтобы другие люди могли его использовать, вы должны договориться о том, чтобы пространство имен ваших понятий соответствовало описывающему их документу. Таким образом, если вы создаете словарь, который задает http://example.org/vocab/pet#Iguana
, HTTP GET для этого URL или для http://example.org/vocab/pet
должен доставить сам документ онтологии. А еще лучше, вы будете осуществлять согласование содержимого HTTP (connectg), чтобы пользователи могли запрашивать документ в форматах application/rdf+xml
, text/turtle
и т. Д. Если ваш словарный запас предназначен для внутреннего использования в интрасети или только для демонстрационных / исследовательских целей, публикация не обязательно является шагом, который вам необходимо предпринять.
Ключевым компонентом связанных данных или семантической сети является то, что определения используются повторно, где это возможно, чтобы приложения могли видеть, как наборы данных связаны между собой. Например, если в вашем словаре есть понятие имени, рассмотрите возможность повторного использования предикатов имен из FOAF , а не придумывайте свой собственный. Вы упоминаете Dublin Core - этот словарь широко используется в других онтологиях. Этот аспект моделирования может занять некоторое время, чтобы стать правильным, но обычно это будет итеративный процесс, и это нормально. Существуют сообщества, в которых вы можете получить помощь, и растет число консультантов, которые предлагают профессиональную помощь.
Как и в случае с любым программным обеспечением, чем яснее вы с самого начала будете знать о своих предполагаемых пользователях и их требованиях, тем проще будет разработать вашу онтологию.