Я ищу в Hbase хранилище действий пользователя без схемы ("пользователь х просмотрел у", "пользователь х просмотрел у со страницы z").
HBase кажется отличным выбором, поскольку
- сохраняет данные в формате без схемы, а также
- может поддерживать сложные запросы, такие как СУБД
Да, соображения производительности будут позже.
Вопрос 1: Какие функции СУБД я пропущу , если буду использовать HBase?
Если бы я использовал СУБД, я бы использовал такие функции, как SUM, WHERE, GROUP BY, ORDER, BETWEEN, сравнения и (внутренние) объединения; и до 2NF нормализации. Ничего более сложного.
Вопрос 2: Помимо запросов, как насчет:
- изменение схемы
- одношаговое резервное копирование всего кластера
- репликация и кластеризация master-slave (извините, это может быть больше вопросом Hadoop, но в обзоре HBase он рассматривается отдельно)
которые просты в РСУБД?