Я не думаю, что "сканирование" - это правильная терминология, которую следует использовать, когда речь идет о базах данных.Сканирование - это особый вариант использования, когда вы хотите "сканировать" веб-страницы, вы не знаете, с чего начинаете.Вы не знаете, какова конечная точка.Следовательно, вы начинаете в какой-то момент и пытаетесь выяснить, что там лежит.
Когда дело доходит до базы данных, базы данных NOSQL, такой как HBase.Вы уже «знаете», что находится в этой базе данных.Все, что вам нужно сделать, это получить информацию полностью или частично получить то, что в ней, на основе конкретных запросов.
Я вижу, что, возможно, в вашем случае вы могли бы настроить Lucene для построения ваших индексов из данных, запрашиваемых из HBase, а затем передать эти индексы в Solr для создания полноценного поискового приложения.
Надеюсьэто может быть направление, которое вы ищете.