У меня есть таблица Hive Parquet, которую я создаю, используя Spark 2.3 API df.saveAstable....
Я пытаюсь оптимизировать производительность для работы Spark, используя метод bucketing . Я читаю...
Я использую ноутбук Jupyter в системе с 64 ГБ ОЗУ, 32 ядрами и 500 ГБ дискового пространства....
Var test = spark.read.format (spark.read.format ("com.crealytics.spark.excel"). Option...
У меня есть фрейм данных pyspark, где его размерность (28002528,21), и я попытался преобразовать...
Работая над улучшением производительности кода, поскольку многие задания не выполнялись (прервано),...
Я пытаюсь вставить данные в управляемую таблицу Hive, в которой есть раздел. Показать выходные...
Я хочу собрать zeppelin 0.8.0 со встроенной искрой 2.3.2 и запустить ее на той же версии spark,...
Мой проект SPARK (написанный на Java) требует доступа (результаты запроса SELECT) к различным...
Похоже, улей replace columns не работает с искрой 2.2.1, а также с 2.3.1 alterSchemaSql : alter...
Я больше не могу сохранить таблицу в базе данных улья, используя metastore.Я вижу таблицы в spark,...