Я массово загружаю HBase из Spark, пишу в HFiles через HFileOutputFormat2.Все хорошо до массовой загрузки, когда кажется, что на окончательной паре файлов зависает
INFO org.apache.hadoop.hbase.tool.LoadIncrementalHFiles:
Split occurred while grouping HFiles,
retry attempt 632 with 2 files remaining
to group or split
Есть идеи?Не уверен, что мои HFiles перекошены?Слишком большой?(Они только в 10-х мегабайтах, а мой hbase.region.max.filesize = 10 ГБ)