Я сканирую таблицу hbase, которая содержит миллиард строк и распределена по 500 регионам, обслуживаемым примерно 50 серверами регионов.Я получаю проблемы с производительностью при сканировании таблицы.проблема производительности является случайной.Иногда сканирование возвращает данные за 2-3 секунды, но иногда это занимает почти 50 секунд.Я использую сканирование с помощью ключа запуска и фильтра префиксов.
Я прочитал о добавлении ключа завершения сканирования.но это также не гарантирует, что даст результат за меньшее время.Также я прочитал об использовании rowprefixfilter.Хотите знать, как лучше всего сканировать данные?