Во время миграции данных Hbase я встретил java.lang.IllegalArgumentException: KeyValue size too large
В долгосрочной перспективе:
Мне нужно увеличить свойства hbase.client.keyvalue.maxsize
(с 1048576 до 10485760 ) в /etc/hbase/conf/hbase-site.xml
, но я не могу сейчас изменить этот файл (мне нужна проверка).
В краткосрочной перспективе:
У меня есть успех при импорте данных с использованием команда:
hbase org.apache.hadoop.hbase.mapreduce.Import \
-Dhbase.client.keyvalue.maxsize=10485760 \
myTable \
myBackupFile
Теперь мне нужно запустить задание Spark, используя spark-submit
Что лучше:
- Префикс свойств HBase с помощью ' искра «. (Я не уверен, что это возможно, и если это работает)
spark-submit \
--conf spark.hbase.client.keyvalue.maxsize=10485760
- Использование 'spark.executor.extraJavaOptions' и 'spark.driver.extraJavaOptions' для явной передачи свойств HBase
spark-submit \
--conf spark.executor.extraJavaOptions=-Dhbase.client.keyvalue.maxsize=10485760 \
--conf spark.driver.extraJavaOptions=-Dhbase.client.keyvalue.maxsize=10485760