Использование приведенной ниже команды на моем экземпляре AWS EC2 с запущенным PySpark. final_rdd
$ HADOOP_HOME / bin / hadoop jar ProductSalePerCountry.jar / inputMapReduce /...
У меня есть код: import org.apache.spark.SparkConf import org.apache.spark.SparkContext import org
Вопрос 1: Я хочу найти файлы журнала MapReduce, чтобы проверить значения некоторых переменных в...
Кто-нибудь знает, как найти, когда строки таблицы последний раз обновлялись / вставлялись?Presto...
Я новичок в улье.Пожалуйста, помогите с моей проблемой ниже. У меня есть таблица ниже в кусте с...
Я установил Hive и Hadoop на свою Ubuntu VM. Когда я запускаю hive на терминале, я получаю это:...
Предположим, что есть таблица со столбцами, в которых указаны детали успеваемости ученика....
У меня есть данные, как показано ниже: id,name,description,category 1,sid,I am don,right?...
У меня есть около 10 файлов в том же месте HDFS. Все файлы имеют одинаковые столбцы (около 15),...
Я могу запустить эту команду для HDFS: hadoop fs -ls /user/hive/warehouse/databasename.db/tablename...
Можно ли установить CM поверх существующего кластера без CDH? Например, я вручную установил Hadoop...
У меня есть кластер из 3 узлов в AWS (1 ведущий и 2 ведомых) Конфигурации: мастер (8 vCPU, 16 ГБ)...
Я пытаюсь настроить установку HDP с одним узлом на моей виртуальной машине с операционной системой...
Я пытаюсь импортировать данные mySql в Hadoop с помощью sqoop. Окружающая среда: Ubuntu 16.04...
Мне нужно извлечь файлы из HDFS и запустить их каждый раз с помощью процессора SelectHiveQL. Я не...
Мы использовали spark с java и создали Java REST api для вызова нашего spark кода. После вызова...
Я пробую статическое и динамическое разбиение в улье. Статическое разбиение работает хорошо, но...
я работаю над своим дипломным проектом и его использованием Impala, поэтому я хочу спросить, есть...
Я отправляю свою работу spark на yark с использованием сценариев Unix и команд spark-submit.Я...
Когда я запускаю программу map-Reduce в кластере, входной путь рассматривается как выходной путь,...
Какова наилучшая практика подключения Splunk к Hadoop или другим платформам данных, является ли...
Можем ли мы использовать cube.js для целей отчетности. Если возможно, то как интегрировать cube.js...
Я пытаюсь импортировать документы из коллекции из MongoDB и создать таблицу в HIVE. Вот запрос...
Давайте рассмотрим сценарий, в котором моя программа получает доступные датододы из namenode, а...