Привет, мне нужна помощь, пожалуйста, как оптимизировать этот код, чтобы все функции использовали...
Вот мой файл yarn-site.xml: <property> <name>yarn.nodemanager.aux-services</name>...
Я работаю над запросом в улье.В этом я использую агрегаты, такие как операторы sum и case и group...
Я читаю о зеркалировании в MapR.У меня есть сомнения, что является основной целью зеркалирования в...
Когда и где HDFS создает папку .Trash? Есть ли какое-либо правило или логика, какая-либо ссылка?
У меня есть таблица улья с 2 разделами, и 1-й раздел - это город, а второй раздел - деревня, так...
Я писал приложение MapReduce для выполнения соединения на стороне сокращения на двух таблицах (один...
Как мне установить hadoop 2.8.0 вместо hadoop 3.1.1 через brew? или как использовать brew для...
У меня есть 3 сервера улья в моем кластере.Я хотел бы остановить один из них, так как это не...
Я задаю этот вопрос, потому что мое переименование S3 файлов, которые я генерирую с помощью spark,...
Я хочу запустить приложение MapReduce, используя Hadoop 2.6.5 (в моем собственном родном кластере),...
Я хочу выполнить обновление запроса в SQL с использованием pyspark на основе некоторой логики,...
В моем кластере я определил local.cache.size до 10 ГБ, но я видел какой-то файл размером около 24...
Я подключаюсь к hdfs, используя Kerberos в качестве механизма аутентификации, я запускаю задание,...
Я выполняю задания синтаксического анализатора для синтаксического анализа файлов json и загрузки...
Я использую scala версии 2.11.4 с spark 2.1.1 и hadoop версии 2.6.0-cdh5.7.1.ниже приведены...
У меня Hive LLAP развернут в кластере с помощью ползунка.Подсказка Hive четко отправляет задания...
Я пытаюсь установить hadoop 2.8.5, все демоны успешно работают, но не могут запустить...
Мне нужно создать приоритетные очереди для определенных заданий, чтобы задания можно было выполнять...
Мои данные как показано ниже ВРЕМЯ = 2012111 | evnt = XYA | SESN = ABC | SVNM = ВРЕМЯ ОКЛ = 2012111...
У меня есть две большие таблицы, разбитые по столбцу даты.Они сохраняются в виде паркетных файлов в...
Я делаю подсчет слов, поэтому маппер возвращает пары ключ и значение zz 1 zz 1 b 1 c 1 , и мой...
Я хочу понять, что делать в следующем случае.Например, у меня есть 1 ТБ текстовых данных, и давайте...
Я использую зависимость в моем проекте Maven <dependency> <groupId>org.apache
Я новичок в Spark. Я не могу узнать, как обрабатывать журналы в режиме Spark Cluster. Я добавил...