Вопросы с тегом hadoop

0 голосов

0 ответов

Используйте Hbase для равного соединения

Я работаю над Data.csv, представленным как key1, val1 (например, A, B и B, C и т. Д.), Чтобы найти...

Kaco Hokow / 01 декабря 2018

0 голосов

0 ответов

Что происходит в Hadoop, когда промежуточные данные (т. Е. Выход разлива картографа) теряются?

Hadoop хранит промежуточные данные - выходные данные разлитого картографа на локальный диск, как...

cozos / 01 декабря 2018

0 голосов

1 ответ

Hadoop - копирует набор данных из внешнего в HDFS напрямую

Я пытаюсь использовать distcp для копирования сжатого файла ~ 500 МБ в HDFS, но получаю ошибку...

user2727704 / 01 декабря 2018

0 голосов

1 ответ

Почему MapReduce дает сбой / время ожидания?

Я получаю эту ошибку при запуске примера приложения mapreduce в пряже и задаюсь вопросом, может ли...

Gus / 01 декабря 2018

0 голосов

0 ответов

Ошибка zeppelin: объект hbase не является членом пакета org.apache.hadoop

Я написал запрос hbase в scala spark, и он работает хорошо.Я хочу реализовать это в записной книжке...

SimbaPK / 30 ноября 2018

0 голосов

0 ответов

Mapreduce разные ключи выдают разное количество сообщений

У меня небольшая проблема с заданием mapreduce, имеющим разное количество сообщений, если я...

Georgi / 30 ноября 2018

0 голосов

2 ответов

Список недублированных записей из столбца улья

Мне нужно найти список неповторяющихся записей из столбца в кусте. Поддержка, если у меня есть...

techie / 30 ноября 2018

0 голосов

2 ответов

Использование jq для возврата конкретной информации в объект JSON

Я хочу проанализировать отдельные элементы внутреннего объекта JSON для сборки / загрузки в базу...

akash sharma / 30 ноября 2018

0 голосов

0 ответов

размер файла в улье больше, чем обычно

Я использую песочницу maprR для тестирования различных настроек в кустах и MaprF.Я получил в...

MayaK / 30 ноября 2018

0 голосов

1 ответ

SparkException: задача не выполнена при записи строк

Использование spark-streaming для получения данных из Kafka и последующей записи их в HDFS в...

user2894829 / 30 ноября 2018

0 голосов

0 ответов

Контейнер LLAP ползунка Apache не запускается

Я пытаюсь запустить контейнер LLAP, и я вижу следующую ошибку в журнале контейнера Log Type:...

Vijay Muvva / 30 ноября 2018

0 голосов

1 ответ

Impala одиночная вставка оператора создания нескольких файлов

У меня есть управляемая таблица Impala, и я пытаюсь выполнить запрос вставки одного оператора в...

Avijit / 30 ноября 2018

0 голосов

0 ответов

Исключительная ситуация тайм-аута при записи в HDFS - java.util.concurrent.TimeoutException: время ожидания фьючерса истекло после [100000 миллисекунд]

Ценю вашу помощь заранее.Уже 2-й день я продолжал пробовать все перестановки и комбинации, не мог...

Eyedia Tech / 30 ноября 2018

0 голосов

0 ответов

Hadoop MapReduce проблема расчета нескольких средних значений из разных ключевых значений

В настоящее время я работаю над проектом, который требует, чтобы я взял несколько различных...

Jordan McLean / 30 ноября 2018

0 голосов

0 ответов

блокировка hdens namenode при создании

Я просматривал несколько реализаций создания файла в namenode hdfs и увидел, что перед тем, как он...

Rahul Dutta / 29 ноября 2018

0 голосов

1 ответ

Можно ли построить интерфейс REST для запроса данных HDFS?

В настоящее время мы выполняем различные преобразования в наши кластеры HDFS.Будучи новичком в...

rs79 / 29 ноября 2018

0 голосов

1 ответ

Получение «Ошибка: не удалось найти или загрузить основной класс» при запуске EMR?

Я пытаюсь запустить задания в Alibaba Cloud E-MapReduce, он выдает ошибку типа Error: Could not...

Ranjith Udayakumar / 29 ноября 2018

0 голосов

1 ответ

Может ли карта считать события более одного раза?

Я прочитал в учебнике, что Map считает каждое слово в словаре следующим образом: ('house'...

user10680652 / 29 ноября 2018

0 голосов

1 ответ

Избегайте записи файлов для пустых разделов в Spark Streaming

У меня есть задание Spark Streaming, которое считывает данные из разделов kafka ( один исполнитель...

Ruslan Ostafiichuk / 29 ноября 2018

0 голосов

0 ответов

Какова цель обработчика хранилища Phoenix для Apache Hive?

Apache Phoenix предоставляет SQL-подобный интерфейс для данных, хранящихся в HBase.Какова цель...

jl6 / 29 ноября 2018

0 голосов

2 ответов

Установите "hbase.server.keyvalue.maxsize" программно через Java

Я выполнял операции hbase через загрузку Java Spring.Я получаю сообщение об ошибке "Ячейка размером...

Rushikesh Garadade / 29 ноября 2018

0 голосов

1 ответ

Apache Ranger 2.0.0-SNAPSHOT: невозможно установить и настроить плагин HDFS

Я установил ranger-admin и ranger-usersync для apache hadoop-2.7.7.Когда я пытаюсь установить,...

abhinavchat / 29 ноября 2018

0 голосов

1 ответ

Spark Streaming: текстовый источник данных поддерживает только один столбец

Я потребляю Kafka данных и затем передаю данные в HDFS. Данные, хранящиеся в Kafka теме trial,...

user2894829 / 29 ноября 2018

0 голосов

0 ответов

Ошибка Pyspark при запуске кода логистической регрессии

Мы используем Jupyter для pyspark.Мы попытались запустить логистическую регрессию, которая не дала...

anmol majithia / 29 ноября 2018

0 голосов

0 ответов

проверить данные в недельном кругу в Импала

У меня есть набор данных о людях со студентами (студент = 1), и я должен следить за этими...

Anna / 29 ноября 2018