Распределенное реплицированное двоичное хранилище для больших наборов данных - PullRequest
1 голос
/ 20 декабря 2011

Нам нужно какое-то существующее решение для очень узкой задачи: хранилище многократных временных рядов с однократной записью.

Свойства, которые нас интересуют:

  • низкая задержка чтения
  • реплицируются
  • масштабируемый (возможность добавлять больше ресурсов, как в физическом, так и в денежном выражении)

Мы попробовали хранилище данных Google AppEngine с данными, разбитыми на ~ 1M BLOB-объектов. К сожалению, задержка чтения и цены не так уж и приятны.

Варианты, которые мы собираемся рассмотреть:

  • Amazon SimpleDB
  • HDFS / HBase на нашем собственном хостинге
  • Некоторые из породы NoSQL (Токийский Тиран?)
  • BLOB-объектов в MySQL (однако необходимо выполнить ручное разбиение)

Мы что-то упустили? Должны ли мы рассмотреть другие варианты или расставить приоритеты один над другим?

Ответы [ 2 ]

3 голосов
/ 23 марта 2012

Попробуйте Luster и или Ceph.Оба имеют (или будут иметь) коммерческую поддержку.

2 голосов
/ 21 декабря 2011

Возможно, вы также захотите взглянуть на Microsoft Azure Storage Services. Они предоставляют BLOB-объекты, таблицы (нереляционные) и очереди по разумной цене.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...