Какой NoSQL ... еще раз :), но другой вариант использования - PullRequest
3 голосов
/ 12 марта 2012

Предложения для хранилища данных NoSQL, чтобы мы могли легко загружать данные и генерировать отчеты Qlikview в режиме реального времени?

Легко означает: 1. Поддержка Qlikview для операций чтения (доступен соединитель, в противном случае, возможно, можно записать соединитель JDBC, в противном случае, возможно, можно записать пользовательский соединитель QVX в хранилище данных)

  1. Легко адаптируется к изменениям схемы или без схемы.Мы меняем нашу схему довольно часто ...
  2. Поддержка Java для записи
  3. Сверхбыстрое чтение - инкрементный доступ в реальном времени, а также пакетный доступ к старым данным в пределах временного диапазона.Я читал, что Cassandra превосходит по диапазонам.
  4. Разумно быстрая запись
  5. Разумно большое хранилище данных - 20 миллионов строк, хранимых в день, около 200 байтов каждая
  6. Было бы неплохо, если быможет масштабироваться за годы данных, эластичность не так важна.
  7. Простота в использовании, установке и эксплуатации.Рассматривая минимальное время установки и настройки.
  8. Поддержка Matlabe для adhoc-запросов

Изначально я не думаю, что нам нужна распределенная система, однако возможен кластер.

Я посмотрел на Монгодба, Кассандру и Хбасе.Я не думаю, что переход на REST является хорошей идеей из-за (теоретически) более низкой производительности.

Сейчас я склоняюсь к MongoDB из-за его простоты использования, поддержки matlab, полностью без схемы, Qlikviewподдержка (доступна бета-версия).Однако, если кто-то может предложить что-то лучшее, это было бы здорово!

1 Ответ

0 голосов
/ 12 марта 2012

В зависимости от серверной инфраструктуры, которую вы будете использовать, я думаю, что лучшим выбором будет сервис Amazon NoSQL, доступный в aws.amazon.com .

Дело в том, что любая БД будет иметь низкую производительность в облачной инфраструктуре из-за того, как она хранит данные, например, Amazon EC2 с EBS ОЧЕНЬ медленен для этой задачи, требуя подключения до 20 томов EBS всовершить набег на приличную скорость.Они решили эту проблему, создав службу NoSQL, которую я никогда не использовал, но, кажется, приятно.

...