У меня есть следующий набор в моем mapred-site.xml в моей системе ec2, где работает мой Hadoop:...
У меня есть оператор выбора, который я храню в кадре данных .... val df = spark.sqlContext
Я выполняю свою искровую работу как режим клиента пряжи, для которого, Мне нужна баночка с гуавой...
Я новичок в Kerberos / hive, хочу подключить куст (Kerberos реализован) с использованием JDBC. >...
Это мой код: package hadoopPlayground; import java.io.BufferedReader; import org.apache.avro
hive -f ${path}/hive_load_$tablename.hql -hivevar ${db}=$db -hivevar ${START_DATE}=$START_DATE...
Я новичок в Spark, поэтому мне нужно создать RDD только с двумя элементами. Array1 = ((1,1)(1,2)(1...
Мы сталкиваемся с проблемой, когда происходит сбой sparkthrift после выполнения многих запросов...
У меня есть тест Scala, который работает в Intellij, но не работает в терминале с использованием...
У меня есть таблица в Hive, и я запускаю код pyspark, чтобы добавить столбец к этой таблице hive....
Я пытаюсь настроить Hadoop 3.1.1 на Mac. Любой совет, какие файлы мне нужно редактировать внутри...
Я не смог найти ответ на свой вопрос, если есть похожий пост, пожалуйста, отправьте меня туда. У...
Предположим, что приведенная ниже таблица: в качестве схемы: ID,NAME,Country и my partition key is...
После 2.Быстрый старт - автономная инструкция HBase Я установил автономную HBase на свой Macbook
Я работаю в Cloudera и только начал изучать это.Поэтому я пытался реализовать знаменитый пример в...
Я сделал некоторые изменения в yarn-site.xml, и после этого я не смог открыть улей. Я удалил...
Как получить доступ к скрытым файлам (файлам, которые начинаются с 'underscore' и 'dot') из...
Я создаю веб-приложение для анализа данных с интерфейсом Angular 6, бэкэндом Django 1.11 и Hadoop....
Я просто запускал разные задания с одинаковой средой jar-зависимостей в hadoop.И перед началом...
Моя команда должна создать базу данных HIVE для обработки и доступа к очень большому количеству...
Среда * Virtual Box - 3 machine (192.168.0.**100(master)/101/102**) * Ubuntu Server 18 * Hadoop 3.1
У меня есть таблица, созданная в Hive CREATE EXTERNAL TABLE my_db.my_table PARTITIONED BY (ds...
Я запускаю сценарий pyspark, используя spark-submit.Задание выполняется успешно. Теперь я пытаюсь...
Тестирование Cloudera 5.15.1 BDR, немного запутанный в репликации HDFS и HDFS Snapshot.используя...
Это код, который я запускаю: bigrams = LOAD 's3://******' AS (bigram:chararray, year:int,...