Я пытаюсь выяснить, как настроить размер блока (или размер фрагмента) отдельных объектов,...
Я использую Apache Spark и Hadoop для создания таблиц Hive в моем хранилище данных. Моя проблема в...
Ниже моя функция искры, которая прямо вперед def doubleToRound(df:DataFrame...
Допустим, у меня есть таблица улья, которая имеет 3 строки: merchant_id, week_id, acc_id. Моя цель...
У меня есть некоторые данные, поступающие из внешнего источника в формате: user_id, user_name,...
Мне нужно отредактировать каталог журналов (содержит файлы application_ *) для hadoop. В настоящее...
Я пытаюсь понять, какие существуют архитектуры для интеграции данных в реальном времени и как все...
У меня странная проблема при импорте данных в таблицу разделов.Ниже приведен запрос. INSERT...
Я хочу написать программу на C в Visual Studio 2017, которая записывает некоторые случайные...
Я новичок в hadoop, и недавно, когда я выполнял задания MapReduce в кластере Hadoop Openstack и cd...
Я использую Ambari Sandbox. Я хочу проверить размер базы данных куста за определенный промежуток...
Я читал, что фаза сокращения состоит из трех задач - перемешать, отсортировать и уменьшить....
Все, я пытаюсь найти наиболее эффективный способ хранения данных в моей таблице Hive, который...
пароль rangerusersync, кажется, состоит из 2 частей легко изменить (для аутентификации API / UI) -...
Мой вопрос теоретический, Я пытаюсь создать дизайн для примера mapreduce в области обработки...
Я работаю над проектом, который использует hdfs, и я хочу сохранять данные arduino в hadps hadoop...
Я пытался настроить кластер Hadoop с одним узлом на моей машине с Windows. Но на последнем шаге,...
У меня есть семейство столбцов с сгенерированными столбцами и большими данными в нем.Каждый столбец...
Я использую менеджер ресурсов пряжи для искры.после перезапуска сервера пряжи все выполненные...
Я хочу убить некоторые задачи, потому что их результаты не были проверены.Но я хочу написать...
Я пытаюсь вставить данные в таблицу кустов из файла в каталоге hdfs по запросу: $...
Я хотел использовать foreachPartition на фрейме данных, чтобы отправлять данные каждой строки...
Скажем так: у нас в Hive хранится таблица, разбитая на дату.Например: у нас есть таблица с именем...
Может кто-нибудь подробно объяснить используемые ресурсы, минимальные ресурсы и максимальные...
Я пытаюсь написать редуктор картографирования для Hadoop, чтобы найти фильмы с 5-ю оценками...