Попробуйте lily project, это касается индексации данных таблицы hbase, и индексированные данные могут быть легко использованы для реализации поиска.вот ссылка, на которую вы можете сослаться
http://www.lilyproject.org/lily/index.html
Lily объединяет Apache HBase, Hadoop и Solr во всеобъемлющую интегрированную интерактивную платформу данных с простыми в использовании API доступа,модель данных и язык схем высокого уровня, гибкое индексирование в реальном времени и выразительные возможности поиска Apache Solr.Лучше всего, Лили с открытым исходным кодом