Граф базы данных против тройных магазинов - PullRequest
26 голосов
/ 12 февраля 2011

Какой в ​​настоящее время лучший выбор для сохранения графоподобных структур?Базы данных графиков (например, Neo4j ) или тройные хранилища RDF (например, Virtuoso )?

Например, у нас есть следующий вариант использования:

  • слабо связанный граф (похожий на один из научных трудов в сборнике) с почти 10M узлами;
  • довольно редкие обновления;
  • критические операции: получение определенных подграфов, обновление узлов в данном подграфе, повторное вычисление мер анализа ссылок (например, HITS или PageRank) после обновления некоторых узлов.

Также желательно предоставить стандартный API для запроса данных для сторонних приложений (например, Facebook или Twitter).

Ответы [ 2 ]

11 голосов
/ 12 февраля 2011

С Virtuoso у вас есть следующие работающие для вас:

- SPARQL, SQL, SPASQL (SPARQL внутри SQL) и SQL внутри поддержки SPARQL (например, для работы с N-арными отношениями с помощью магических / функциональных предикатов / свойств.

- работает как компактный движок (например, эксплуатируемый через KDE Desktop) или как массивная СУБД, как продемонстрировано с помощью живого 17 миллиардов триплетов + облачного кэша LOD или меньшего живого экземпляра DBpedia.

- включает полнотекстовое индексирование и текстовые шаблоны в SPARQL (через bif: contains), также включено XPath / Xquery (через xcontains)

- Кислотный или некислотный режим То же самое по схеме Schema-Last при работе с Property Graph Store

- Посредством промежуточного программного обеспечения преобразования он может извлекать данные из более чем 80 источников данных (включая API-интерфейсы REST, службы SOAP, Hypermedia Resource, доступные для реляционных источников данных ODBC или JDBC и т. Д.) И преобразовывать их в графы временных или постоянных связанных данных

- Публикация связанных данных происходит автоматически, т. Е. После создания записи СУБД у вас есть встроенные Страницы связанных данных, которые отображаются в виде СУБД. Нет возиться с ре. Правила перезаписи URL, 303 перенаправления или что-то в этом роде. Супер-ключи от InterWeb просто работают!

Вот и все: -)

8 голосов
/ 09 марта 2011

Для горизонтального масштаба (таким образом, для небольших и средних баз данных) графовые базы данных, такие как neo4j, в настоящее время будут давать лучшую производительность для обходов графов. Триплеты наверстывают упущенное. Большим преимуществом Triple Store по сравнению с базой данных графиков является то, что дампы данных и язык запросов стандартизированы, что означает, что их гораздо проще перенести на другой продукт и избежать блокировки поставщиков.

...