Я хотел бы построить дерево B +, охватывающее несколько узлов
компьютерная сеть (внутренняя подсеть компьютеров Linux) для
эластичное массивное хранение. Сканирование диапазона важно.
Это в основном базовая структура данных
распределенные системы БД? (Кассандра, HBase)
Есть ли какие-нибудь исследования по распределенным деревьям B +?
Я видел статью в
http://www.cs.yale.edu/homes/aspnes/papers/opodis2005-b-trees-final.pdf
но пропустите BTrees, просто удалите неисправные узлы (что приводит к потере данных)
Меня особенно интересуют деревья B + со встроенной избыточностью
(то есть, если происходит сбой хоста и все узлы, которые он размещает, отключены,
Я бы хотел, чтобы другой реплицированный хост стал основным узлом
сервер и занять место неисправного хоста)
Я не хочу использовать коллекцию экземпляров БД
(1 узел, одна БД), так как шардинг не является хорошим выбором
для крупномасштабной системы хранения (по всему товару
аппаратное обеспечение x86, x64 с ОС FOSS).
Я заново изобретаю колесо?
Должен ли я просто использовать Cassandra или HBase?