Загрузка Notation3 в базу данных - PullRequest
6 голосов
/ 08 марта 2011

Как вы анализируете и загружаете тройки, представленные файлом Notation3, в базу данных?Я немного знаком с Jena и Sesame , но они, похоже, предназначены для обработки RDF или Turtle, а не для полной нотации 3.

Я нашел относительно немного надежных инструментов для работы с N3.Те немногие, что я нашел, перечислены здесь и состоят только из грубых скриптов Python, которые могут выполнять только базовые действия командной строки и, кажется, не имеют стандартной упаковки, распространения или обслуживания.Библиотека Python по умолчанию выглядит как notation3.py, но я не смог найти для нее ни одной домашней страницы и обнаружил десятки разных версий, разбросанных по Интернету.

Например, скажем, у меня есть следующий N3, представляющийботаническая классификация:

{
   []
       :genus "Abies" ;
       :species "alba" ;
       :name [:value "Silver Fir" ; :usage "common" ; :language "English" ] ;
       :name [:value "European Silver Fir" ; :usage "common" ; :language "English" ] ;
       :name [:value "abeto blanco" ; :usage "common" ; :language "Spanish" ] ;
       :name [:value "abeto plateado" ; :usage "common" ; :language "Spanish" ] ;
       :name [:value "Edeltanne" ; :usage "common" ; :language "German" ] ;
       :name [:value "Silbertanne" ; :usage "common" ; :language "German" ] ;
       :name [:value "Weißtanne" ; :usage "common" ; :language "German" ] ;
       :stem!:type :erect ;
       :stem!:height [ :value!:start 30.0 ; :value!:end 50.0 ; :value!:units "m" ] ;
       :bark!:color :grey ;
       :bark!:ridges :irregular ;
       :foliage!:seasonality :evergreen ;
       :foliage!:type :needle ;
       :foliage!:arrangement :alternate ;
       :foliage!:length [ :value!:start 1.0 ; :value!:end 3.0 ; :value!:units "cm" ] ;
       :foliage!:width [ :value!:start 0.2 ; :value!:end 0.3 ; :value!:units "cm" ] ;
       :foliage!:color :green ;
       :foliage!:spiney :FALSE ;
       :flower [ :gender :male ; :inflorescence :catkin ; :sense :straight ; :color :brown ] ;
       :flower [ :gender :male ; :inflorescence :catkin ; :sense :straight ; :color :yellow ] ;
       :flower [ :gender :female ; :inflorescence :catkin ; :sense :straight ; :color :pink ] ;
       :fruit [ :kind :cone ; :color :brown ; ] ;
}
:is-a :botanical-classification ;
:source [
   :uri <http://originating/site> ;
   :name "John Doe" ;
   :data-collection-date "2005-01-01" ;
] ;
:transcribed-by "Al Nonymous" ;
:transcription-date "2010-09-01" .

Я хочу иметь возможность загружать эту (и, возможно, тысячи аналогичных записей) в базу данных, чтобы я мог выполнять произвольные запросы типа: «Кто расшифровал записи, содержащие общие испанские имена в году2010?»или «Какой средний цвет цветка ассоциируется с родом X?»

Это практично в настоящее время делать с текущими инструментами семантической сети и N3?

1 Ответ

3 голосов
/ 09 марта 2011

Основная проблема в том, что N3 всегда был чем-то вроде экспериментальной нотации - полный язык никогда не был широко реализован. Диаграмма в этом документе довольно информативна: ваш пример использует графические литералы, и они лежат вне любого из широко реализованных подмножеств N3. Теперь, когда именованные графы используются более широко, можно было бы выразить ту же информацию в большинстве систем RDF, включая Jena, но не путем непосредственного анализа вашего входного файла.

Если бы это был я, я бы хотел написать этап преобразования внешнего интерфейса, возможно, с использованием языка, который хорош в строках и шаблонах, например Ruby. Затем вы можете перевести свои входные файлы в форму, которую могут обрабатывать стандартные процессоры RDF. Например, графический литерал, который обозначает операторы, сделанные "Al Nonymous", может быть преобразован в bNode, обозначающий действие Al, утверждающего эту классификацию. В качестве альтернативы вы можете извлечь каждый граф из его литерала и сохранить его в файле с именем синтезированного графа, тем самым сохранив структуру вложенных графов, которая у вас есть в настоящее время. Аналогично, запись property!path может быть легко переписана в стандартный RDF за счет того, что она немного более многословна.

В качестве альтернативы, попросите вашего поставщика данных предоставить вам вывод в более удобной для обработки форме!

...