Вопросы с тегом hadoop

0 голосов

1 ответ

СДР не сохраняется как текстовый файл в pyspark

Использование приведенной ниже команды на моем экземпляре AWS EC2 с запущенным PySpark. final_rdd

Pranav Shankar / 12 июня 2019

0 голосов

0 ответов

Контейнер убит по запросу.Код выхода: 143 java.io.IOException: Задание не выполнено

$ HADOOP_HOME / bin / hadoop jar ProductSalePerCountry.jar / inputMapReduce /...

Micha93 / 12 июня 2019

0 голосов

1 ответ

Как написать с Spark на удаленный узел Elastic Search?

У меня есть код: import org.apache.spark.SparkConf import org.apache.spark.SparkContext import org

Joe / 11 июня 2019

0 голосов

0 ответов

Не удается найти файлы журнала hadoop Mapreduce

Вопрос 1: Я хочу найти файлы журнала MapReduce, чтобы проверить значения некоторых переменных в...

Kevin chen / 11 июня 2019

0 голосов

1 ответ

Presto SQL: как найти дату последнего обновления таблицы

Кто-нибудь знает, как найти, когда строки таблицы последний раз обновлялись / вставлялись?Presto...

Chuck Pedro / 11 июня 2019

1 голос

1 ответ

Объединить столбцы в улье

Я новичок в улье.Пожалуйста, помогите с моей проблемой ниже. У меня есть таблица ниже в кусте с...

Tharunkumar Reddy / 11 июня 2019

1 голос

1 ответ

Невозможно запустить Hive в Ubuntu

Я установил Hive и Hadoop на свою Ubuntu VM. Когда я запускаю hive на терминале, я получаю это:...

AbderrahmenM / 11 июня 2019

2 голосов

2 ответов

Как написать подзапрос в операторе выбора в улье с дополнительным столбцом, одно единственное значение которого получается суммой определенных строк

Предположим, что есть таблица со столбцами, в которых указаны детали успеваемости ученика....

Animesh Kumar / 11 июня 2019

0 голосов

2 ответов

Загрузка данных CSV в таблицы Hive ORC

У меня есть данные, как показано ниже: id,name,description,category 1,sid,I am don,right?...

Siddhesh Kalgaonkar / 11 июня 2019

0 голосов

1 ответ

Как создать одну таблицу Hive, когда у меня есть несколько файлов (в одной папке / каталоге), которые имеют одинаковые столбцы?

У меня есть около 10 файлов в том же месте HDFS. Все файлы имеют одинаковые столбцы (около 15),...

Rspktcod / 10 июня 2019

0 голосов

1 ответ

Как запустить команду файловой системы HDFS через Spark?

Я могу запустить эту команду для HDFS: hadoop fs -ls /user/hive/warehouse/databasename.db/tablename...

Joe / 10 июня 2019

0 голосов

2 ответов

Как установить CM поверх существующего кластера без CDH

Можно ли установить CM поверх существующего кластера без CDH? Например, я вручную установил Hadoop...

Markiza / 10 июня 2019

0 голосов

0 ответов

Задание dmlx XGBoost застряло в Yarn в состоянии «ПРИНЯТО» при последующей передаче

У меня есть кластер из 3 узлов в AWS (1 ведущий и 2 ведомых) Конфигурации: мастер (8 vCPU, 16 ГБ)...

braj / 10 июня 2019

0 голосов

1 ответ

Можно ли настроить HDP с одним узлом без Ambari?

Я пытаюсь настроить установку HDP с одним узлом на моей виртуальной машине с операционной системой...

omaistack / 10 июня 2019

0 голосов

0 ответов

java.lang.NoSuchMethodError: org.apache.hadoop.io.retry.RetryUtils.getDefaultRetryPolicy

Я пытаюсь импортировать данные mySql в Hadoop с помощью sqoop. Окружающая среда: Ubuntu 16.04...

Nadeem Mehraj / 10 июня 2019

0 голосов

0 ответов

В Nifi: как я могу передать несколько файлов, которые извлекаются из hdfs с помощью процессора fetchhdfs, чтобы выбрать и запустить их?

Мне нужно извлечь файлы из HDFS и запустить их каждый раз с помощью процессора SelectHiveQL. Я не...

Keshav Balivada / 10 июня 2019

1 голос

1 ответ

Apache Spark с Java: запуск нескольких запросов приложений одновременно

Мы использовали spark с java и создали Java REST api для вызова нашего spark кода. После вызова...

Rajashekhar Meesala / 10 июня 2019

0 голосов

0 ответов

Ошибка динамического разбиения куста: СБОЙ: Ошибка выполнения, код возврата 2 из org.apache.hadoop.hive.ql.exec.mr.MapRedTask

Я пробую статическое и динамическое разбиение в улье. Статическое разбиение работает хорошо, но...

Ashy Ashcsi / 09 июня 2019

0 голосов

0 ответов

Итерационные функции для Apache Impala

я работаю над своим дипломным проектом и его использованием Impala, поэтому я хочу спросить, есть...

Atef Ibrahim / 09 июня 2019

2 голосов

0 ответов

Код выхода из spark-submit по-прежнему равен 0 в сценарии Unix при сбое приложения пряжи

Я отправляю свою работу spark на yark с использованием сценариев Unix и команд spark-submit.Я...

user10437665 / 09 июня 2019

1 голос

1 ответ

при запуске программы mapreduce на кластере входной путь считался выходным путем

Когда я запускаю программу map-Reduce в кластере, входной путь рассматривается как выходной путь,...

cole / 09 июня 2019

0 голосов

0 ответов

Splunk для Hadoop

Какова наилучшая практика подключения Splunk к Hadoop или другим платформам данных, является ли...

teluchi78 / 09 июня 2019

1 голос

1 ответ

Cube.js как инструмент отчетности

Можем ли мы использовать cube.js для целей отчетности. Если возможно, то как интегрировать cube.js...

user11612392 / 09 июня 2019

0 голосов

0 ответов

Импортировать данные из MongoDB в Hive

Я пытаюсь импортировать документы из коллекции из MongoDB и создать таблицу в HIVE. Вот запрос...

TheRichUncle / 09 июня 2019

0 голосов

0 ответов

DataNode не может записать в первую копию в HDFS. Как будет продолжаться запись?

Давайте рассмотрим сценарий, в котором моя программа получает доступные датододы из namenode, а...

pradeep .p / 08 июня 2019