Для небольшой таблицы (менее 1 миллиона строк и около 1 или 2 ГБ), к которой будет обращаться множество параллельных заданий (вставки и сканирование диапазона), каков наилучший способ создания этой таблицы с точки зрения разделения
Цель - обеспечить хорошую производительность и низкую задержку запросов.
Максимальный размер областей в моем кластере составляет 20 ГБ, и есть 20 узлов с регион-серверами.
Спасибо.
Edit:
- Таблица, доступ к которой выполняется заданиями Spark (и вручную оболочкой Hbase / Phoenix)
- Ключ строки в 2 столбцах (имя таблицы и дата / время)
- Одна вставка по дням + диапазон сканирования