Вопросы с тегом hadoop

0 голосов

0 ответов

Spark Streaming: перезапуск приложения приводит к тому, что файлы не сохраняются в существующий каталог

У меня возникла проблема, когда при повторном запуске задания потоковой передачи, если выходной...

jsell / 28 октября 2019

0 голосов

1 ответ

Каков наилучший способ вызова операций файловой системы Hadoop из объекта Serializable Scala?

/ Что я пытаюсь / Я хочу выполнить преобразование Spark UDF для нескольких блоков HDFS, содержащих...

somnathchakrabarti / 28 октября 2019

2 голосов

1 ответ

Сценарий раздела Hive и его влияние на производительность

Я хочу спросить о количестве разделов улья и о том, как они повлияют на производительность....

amr007 / 27 октября 2019

0 голосов

0 ответов

bash + run cli для запуска команды от пользователя hdfs

У меня есть следующие строки в моем bash-скрипте, чтобы исправить реплицированные файлы в HDFS...

jessica / 27 октября 2019

0 голосов

1 ответ

Как зависит общее хранилище внешнего куста от конкретной версии кластера HDInsight (Hadoop)?

Допустим, у нас есть внешнее Has Metastore, а затем у нас есть группа кластеров Hadoop (HDInsight),...

Dhiraj / 27 октября 2019

1 голос

0 ответов

Счетчики файловой системы Hadoop с компенсаторами MapReduce и без них

Вот некоторые следующие данные, которые я получил от счетчиков Hadoop. Первый - с объединителем,...

kelp99 / 27 октября 2019

0 голосов

0 ответов

недостаточно реплицированные блоки + почему мы получаем это предупреждение при новой установке с нуля?

Мы установили новый кластер Hadoop со следующими подробностями (мы перешли на redhat 7.5 вместо 7

jessica / 26 октября 2019

1 голос

0 ответов

несоответствующий ввод '$ 1', ожидающий LEFT_PAREN

Я новичок в свиноводстве. Я не знаю, правильно ли я поступаю или нет, пожалуйста, помогите мне....

Mitesh Bhanushali / 26 октября 2019

0 голосов

0 ответов

Hive выберите проблемы: java.lang.IncompatibleClassChangeError

У меня есть hadoop3.1.2 с кустом 3.1.2 на win10, проблема в том, что всякий раз, когда я использую...

M.Hu / 26 октября 2019

0 голосов

0 ответов

Приложения для параллельной потоковой искры на YARN EMR

Я столкнулся с проблемой при попытке запустить параллельные задания Spark Streaming на EMR. YARN...

goutham r / 26 октября 2019

0 голосов

0 ответов

Global Sparksession завершается, перезапускается и заканчивается с ошибкой ... при использовании ForEachPartition в Spark / Scala

Я создаю SparkSession в Trait, и объект-компаньон расширяет эту особенность. SparkSessionObject

Voila / 25 октября 2019

0 голосов

1 ответ

Как установить переменную JAVA_HOME в hadoop в Ubuntu 16.04

При установке hadoop в ubuntu-16.04 я получил hdadmin@ubuntu:~/hadoop-2.5.0-cdh5.3.2$ bin/hdfs...

Itachi_Uchiha / 25 октября 2019

0 голосов

0 ответов

Как отладить, почему ожидающий этап находится в неизвестном состоянии?

У меня есть пакетное задание Spark, которое читает некоторые файлы json, записывает их в Hive, а...

marknorkin / 25 октября 2019

1 голос

1 ответ

Как создать секционированную таблицу кустов в динамических каталогах hdfs

У меня возникают трудности при получении куста для обнаружения разделов, созданных в HDFS Вот...

guru107 / 25 октября 2019

0 голосов

1 ответ

Hadoop читает JSON из HDFS

Я пытаюсь прочитать JSON-файл в мой алгоритм map-reduce hadoop. Как я могу это сделать? Я поместил...

TNelen / 25 октября 2019

0 голосов

0 ответов

Цикл и разбиение в сценарии Pig

Предположим, что у нас есть файл с именем details.txt со следующими данными 421,Rajiv,Reddy,21...

Ramprakash Reddymasi / 25 октября 2019

1 голос

1 ответ

как узнать, что файл успешно перенесен с локального в hdfs

мы хотим скопировать локальные файлы в HDFS пример su hdfs -c 'hadoop fs -put -f...

jessica / 25 октября 2019

0 голосов

1 ответ

Производительность фильтра hbase value

как быстро найти указанное значение в hbase? Я пробовал использовать фильтр ниже вместе с...

suraj kulkarni / 25 октября 2019

0 голосов

0 ответов

Как экспортировать результат запроса из Hive по электронной почте?

Я хочу экспортировать результат моего запроса по электронной почте в Hive / Hadoop.

akshay nandanwar / 25 октября 2019

0 голосов

0 ответов

Apache Beam работает на Flink для отправки Avro в HDFS

Я пытаюсь отправить потоковые данные, прочитанные из Kafka, принять и преобразовать, а затем...

Julie Jung / 25 октября 2019

0 голосов

1 ответ

Выполнение нескольких SQL-запросов и тестирование на прохождение или сбой Spark Scala

Я выполняю 100 запросов (тестовых случаев), чтобы проверить качество данных в Spark Scala. Я...

Defcon / 24 октября 2019

0 голосов

0 ответов

Как получить метаданные таблицы в PySpark

Как получить метаданные таблицы в PySpark В Scala API мы можем использовать приведенный ниже...

neeraj bhadani / 24 октября 2019

0 голосов

0 ответов

Hadoop Distcp - проблема с небольшими файлами при копировании из одного места в другое

Я попытался скопировать 400+ ГБ и еще одно задание distcp с размером данных 35,6 ГБ, но на...

Vijay / 24 октября 2019

0 голосов

1 ответ

Как использовать улей крюк в спарк sql

Я использую Hive (2.1.1) hook, как показано ниже: set hive.exec.post.hooks=com.test

Bo.hai / 24 октября 2019

0 голосов

0 ответов

Как загрузить CSV-файл в Hive Table с массивом массивов?

48,Snacks that Power Up Weight Loss,Aidan B. Prince,[[Health&Fitness,Travel],[dance,singing]] 99...

Andres Cadavid / 23 октября 2019