Можно ли сделать тройные магазины масштабируемыми - PullRequest
2 голосов
/ 22 июля 2010

Большинство магазинов, о которых я читал, говорят о масштабируемости примерно до 0,5 миллиардов.

Мне интересно знать, думают ли люди, что есть теоретическая причина, по которой им нужен верхний предел,и знаете ли вы какие-либо конкретные способы сделать их более масштабируемыми.

Мне любопытно узнать, работают ли существующие тройные хранилища следующим образом:

Представляют URI целыми числами Целые числа в порядке Поиск целых чисел вместо URI, который, я думаю, должен быть быстрее (потому что вы можете делать такие вещи, как бинарный поиск и т. Д.)

Мысли ...

1 Ответ

3 голосов
/ 23 июля 2010

Чтобы получить 500 миллионов, тройной магазин должен сделать все это и даже больше.Я провел несколько лет, работая над реализацией тройного магазина, и могу вам сказать, что сломать 1 миллиард троек не так просто, как может показаться.

Проблема в том, что многие запросы rdf имеют 2-й или 3-й порядок (и высшие порядки далеки от неслыханного).Это означает, что вы запрашиваете не только набор сущностей, но и одновременно данные о множестве сущностей;данные о схемах сущностей;данные, описывающие язык схемы, используемые для описания схем сущностей.

Все это без каких-либо ограничений, доступных для реляционной базы данных, что позволяет ей делать предположения о форме этих данных / метаданных / метаметаданных / и т.д.

Есть способы преодолеть 500 миллионов, но они далеки от тривиальных, и низко висящие плоды (т. Е. Подходы, которые вы упомянули) требовались только для того, чтобы добраться туда, где мы сейчас находимся.

При этом гибкость, обеспечиваемая rdf-магазином, в сочетании с денотационной семантикой, доступной посредством ее интерпретации в Description Logics, делает все это стоящим.

...