В распределенном режиме Hadoop используется для хранения HDFS. HBase будет хранить HFile в HDFS и, таким образом, получать преимущества от стратегий репликации и принципов локальности данных, представленных датододами.
RegionServer собирается в основном обрабатывать локальные данные, но все же, возможно, придется получать данные из других датоданов.
Надеюсь, это поможет вам понять, почему и как используется hadoop с HBase.