Предложения для хранилища данных NoSQL, чтобы мы могли легко загружать данные и генерировать отчеты Qlikview в режиме реального времени?
Легко означает: 1. Поддержка Qlikview для операций чтения (доступен mongodb соединитель, в противном случае, возможно, можно записать соединитель JDBC, в противном случае, возможно, можно записать пользовательский соединитель QVX в хранилище данных)
- Легко адаптируется к изменениям схемы или без схемы.Мы меняем нашу схему довольно часто ...
- Поддержка Java для записи
- Сверхбыстрое чтение - инкрементный доступ в реальном времени, а также пакетный доступ к старым данным в пределах временного диапазона.Я читал, что Cassandra превосходит по диапазонам.
- Разумно быстрая запись
- Разумно большое хранилище данных - 20 миллионов строк, хранимых в день, около 200 байтов каждая
- Было бы неплохо, если быможет масштабироваться за годы данных, эластичность не так важна.
- Простота в использовании, установке и эксплуатации.Рассматривая минимальное время установки и настройки.
- Поддержка Matlabe для adhoc-запросов
Изначально я не думаю, что нам нужна распределенная система, однако возможен кластер.
Я посмотрел на Монгодба, Кассандру и Хбасе.Я не думаю, что переход на REST является хорошей идеей из-за (теоретически) более низкой производительности.
Сейчас я склоняюсь к MongoDB из-за его простоты использования, поддержки matlab, полностью без схемы, Qlikviewподдержка (доступна бета-версия).Однако, если кто-то может предложить что-то лучшее, это было бы здорово!