Я работаю над Data.csv, представленным как key1, val1 (например, A, B и B, C и т. Д.), Чтобы найти...
Hadoop хранит промежуточные данные - выходные данные разлитого картографа на локальный диск, как...
Я пытаюсь использовать distcp для копирования сжатого файла ~ 500 МБ в HDFS, но получаю ошибку...
Я получаю эту ошибку при запуске примера приложения mapreduce в пряже и задаюсь вопросом, может ли...
Я написал запрос hbase в scala spark, и он работает хорошо.Я хочу реализовать это в записной книжке...
У меня небольшая проблема с заданием mapreduce, имеющим разное количество сообщений, если я...
Мне нужно найти список неповторяющихся записей из столбца в кусте. Поддержка, если у меня есть...
Я хочу проанализировать отдельные элементы внутреннего объекта JSON для сборки / загрузки в базу...
Я использую песочницу maprR для тестирования различных настроек в кустах и MaprF.Я получил в...
Использование spark-streaming для получения данных из Kafka и последующей записи их в HDFS в...
Я пытаюсь запустить контейнер LLAP, и я вижу следующую ошибку в журнале контейнера Log Type:...
У меня есть управляемая таблица Impala, и я пытаюсь выполнить запрос вставки одного оператора в...
Ценю вашу помощь заранее.Уже 2-й день я продолжал пробовать все перестановки и комбинации, не мог...
В настоящее время я работаю над проектом, который требует, чтобы я взял несколько различных...
Я просматривал несколько реализаций создания файла в namenode hdfs и увидел, что перед тем, как он...
В настоящее время мы выполняем различные преобразования в наши кластеры HDFS.Будучи новичком в...
Я пытаюсь запустить задания в Alibaba Cloud E-MapReduce, он выдает ошибку типа Error: Could not...
Я прочитал в учебнике, что Map считает каждое слово в словаре следующим образом: ('house'...
У меня есть задание Spark Streaming, которое считывает данные из разделов kafka ( один исполнитель...
Apache Phoenix предоставляет SQL-подобный интерфейс для данных, хранящихся в HBase.Какова цель...
Я выполнял операции hbase через загрузку Java Spring.Я получаю сообщение об ошибке "Ячейка размером...
Я установил ranger-admin и ranger-usersync для apache hadoop-2.7.7.Когда я пытаюсь установить,...
Я потребляю Kafka данных и затем передаю данные в HDFS. Данные, хранящиеся в Kafka теме trial,...
Мы используем Jupyter для pyspark.Мы попытались запустить логистическую регрессию, которая не дала...
У меня есть набор данных о людях со студентами (студент = 1), и я должен следить за этими...