У меня здесь небольшой тест / документация.
Мне нужно ежедневно загружать несколько миллионов строк в базу данных. И это не данные файла журнала, у меня есть строки с разделителями-запятыми (столбцов), которые точно соответствуют реляционной базе данных.
После загрузки мне нужно разрешить очень быстрый механизм поиска. Посмотрев немного на реализацию Google Bigtable и структуры вокруг него, я изначально думал об использовании Hive, интегрированного с Hbase. Улей из-за его возможностей запроса. Загрузка работает отлично, лучше чем RDBMS perf. Однако узкое место в запросах, которое было причиной поиска альтернатив СУБД, продолжается и с улья.
Тестирование улья для запросов - не самая лучшая производительность. Возможно, мне нужно искать альтернативы ..
Есть что-то еще? любой другой инструмент / решение / библиотека, которую я могу поставить поверх hbase? или даже без hbase? (Я смотрел на hbase как на альтернативу РСУБД, двигаясь в сторону удаленных вычислений)
Предложения, пожалуйста ...