Подходят ли RDF / Triple Stores для хранения данных приложений? (в отличие от метаданных графика) - PullRequest
0 голосов
/ 04 ноября 2018

Я пытаюсь создать небольшое веб-приложение для " менеджера персональной информации " / wiki-инструмента, где я могу делать заметки в виде фрагментов HTML (или, возможно, Markdown), комментировать их с некоторыми https://schema.org/ микроданными и сохраните как фрагмент, так и метаданные где-то для запросов.

На данный момент я понимаю, что большинство хранилищ семантических данных (тройные / четверные хранилища или базы данных, поддерживающие RDF) лучше подходят для хранения и запроса в основном метаданных . Поэтому мне, вероятно, также понадобится какое-то традиционное хранилище (реляционное, хранилище документов, ключ-значение или даже не-rdf-график db), где я могу хранить полный текст каждой заметки и, возможно, некоторые другие биты, такие как time of last access, user-id, который владеет заметкой и т. Д., А также выполняет традиционные (несемантические) полнотекстовые запросы.

Я начал искать магазины, которые позволили бы хранить метаданные и в одном месте. Я нашел несколько: Ontotext GraphDB, Stardog, MarkLogic и т. Д. Все они, кажется, делают именно то, что я хочу, но имеют довольно ограничивающие условия бесплатной лицензии, которые действительно мешают мне углубленно изучать их: я предпочитаю изучать открытые технологии, которые Я мог бы потенциально использовать на реальном продукте.

Прежде чем копать глубже, мне было интересно:

  1. Если мое предположение верно, то мне нужно использовать одно хранилище для данных, а другое - для метаданных.
  2. если есть какая-либо установка, включающая бесплатное программное обеспечение с открытым исходным кодом, которую могут порекомендовать разработчики, имеющие опыт работы с RDF / Sparql, с учетом описанной проблемы.

Сейчас я просто склоняюсь к использованию Apache Jena для хранилища RDF и запросов SPARQL и чего-то совершенно независимого для остальных данных (наиболее вероятен PostgreSQL).

1 Ответ

0 голосов
/ 14 ноября 2018

Прежде чем копать глубже, мне было интересно:

Если мое предположение верно, то мне нужно использовать одно хранилище для данных, а другое - для метаданных.

Не обязательно, нет, хотя, безусловно, в некоторых случаях это различие может быть полезным. Но большинство баз данных RDF предлагают масштабируемое хранилище для данных и метаданных. Единственное требование - ваши (мета) данные представлены в виде RDF. Если вас беспокоит производительность таких вещей, как текстовые запросы, большинство из них предлагают поддержку полнотекстовой индексации через Lucene, Solr или Elasticsearch.

если есть какая-либо установка, включающая бесплатное / открытое программное обеспечение, которое разработчики, имеющие опыт работы с RDF / Sparql, могут порекомендовать, учитывая проблему, которую я описываю.

Это действительно не то место, где можно задать этот вопрос. Рекомендации инструмента считаются не по теме в StackOverflow, так как они привлекают необъективные ответы. Но, как уже было сказано, есть много инструментов, как с открытым исходным кодом, так и бесплатно, и коммерческих, которые вы можете посмотреть. Я предлагаю вам выбрать тот, который вам нравится, немного поэкспериментировать и, возможно, поговорить с сообществом этого конкретного инструмента, чтобы объяснить, что вы пытаетесь сделать. Apache Jena и Eclipse Rdf4j - два популярных проекта с открытым исходным кодом, но есть множество других.

...