Hbase расщепление для небольшого стола - PullRequest
0 голосов
/ 31 августа 2018

Для небольшой таблицы (менее 1 миллиона строк и около 1 или 2 ГБ), к которой будет обращаться множество параллельных заданий (вставки и сканирование диапазона), каков наилучший способ создания этой таблицы с точки зрения разделения

Цель - обеспечить хорошую производительность и низкую задержку запросов.

Максимальный размер областей в моем кластере составляет 20 ГБ, и есть 20 узлов с регион-серверами.

Спасибо.

Edit:

  • Таблица, доступ к которой выполняется заданиями Spark (и вручную оболочкой Hbase / Phoenix)
  • Ключ строки в 2 столбцах (имя таблицы и дата / время)
  • Одна вставка по дням + диапазон сканирования
...