set hive.stats.autogather=false;
- для вновь созданных таблиц и / или разделов (которые заполняются с помощью команды INSERT OVERWRITE) статистика по умолчанию вычисляется автоматически. Пользователь должен явно установить для логической переменной hive.stats.autogather значение false, чтобы статистика не вычислялась автоматически и не сохранялась в Hive MetaStore.
Статистика на уровне таблицы,
spark.sql("ANALYZE TABLE tableName COMPUTE STATISTICS").show()
, что приводит к
parameters:{totalSize=0, numRows=0, rawDataSize=0...```
Статистика уровня раздела таблицы:
spark.sql("ANALYZE TABLE Table1 PARTITION(ds, hr) COMPUTE STATISTICS").show()
Примечание. Когда пользователь вводит эту команду, он может или не может укажите спецификации раздела. Если пользователь не указывает спецификации разделов, статистика собирается для таблицы, а также для всех разделов (если есть).
Статистика уровня столбца таблицы:
spark.sql("ANALYZE TABLE Table1 PARTITION(ds, hr) COMPUTE STATISTICS FOR COLUMNS").show()
вы можете получить более подробную информацию: https://cwiki.apache.org/confluence/display/Hive/StatsDev#StatsDev -ExistingTables% E2% 80% 93ANALYZE