Предположим, что я удалил схему для существующей внешней таблицы улья, удалив таблицу, данные все...
Я пытаюсь установить Hadoop (3.1.2) на Windows-10, но узел данных и менеджер узлов закрываются. Я...
У меня есть файлы .hql и файл .configuration, в котором содержатся все имена таблиц, которые я хочу...
Я установил кластер небольшого размера, если Hadoop с Hbase для Nutch 2.3.1.Версия hadoop - 2.7.7,...
Я установил hbase в своем локальном ubuntu vm, на котором уже есть hadoop, работающий в режиме...
Следующее соединение для экспорта sqoop не работает sqoop export \ -- connect...
У меня есть данные датчика в реальном времени.Моя основная цель - сохранить необработанные данные.Я...
Я писал программу MapReduce для устранения стоп-слов из заданного ввода, и мое программирование...
Существует ли какой-либо API низкого уровня в Hadoop, позволяющий нескольким задачам сокращения,...
Я пытаюсь переместить данные из greenplum в HDFS с помощью Spark.Я могу успешно прочитать данные из...
У меня возникли проблемы с выполнением операции SUM на NULLS в моем коде pig.Однако я не могу...
Я хочу измерить общее время выполнения моей программы MapReduce, начиная с момента запуска моей...
Я новичок в hadoop.Я хочу ежедневно выполнять определенный запрос и получать информацию, хранящуюся...
Я начинающий со Spark, Hadoop и Yarn.Я устанавливаю Spark с: https://spark.apache.org/docs/2.3.0/ и...
Я пытаюсь перенести задания нашей организации в hadoop на GCP ... Я запутался в потоке данных GCP и...
В Hadoop обязательно, чтобы все ведомые устройства в кластере Hadoop имели одинаковую конфигурацию?...
Я только что добавил новый диск в MapR-FS: И я также включил балансировщик диска: Однако, из...
У меня есть некоторые данные, такие как: - ID PRICE 1 100 2 200 3 120 4 130 5 320 6 300 7 200 8 100...
Каково влияние уменьшения коэффициента репликации HDFS до 2 (или только одного) на карте HBase /...
У меня есть настройка кластера с одним драйвером и двумя исполнителями, работающими в режиме пряжи
У меня есть таблица иерархии с максимальным уровнем родительско-дочерних отношений 15. Мне нужно...
Я написал базовую программу MapReduce на своем MacBook, используя ресурс Apache здесь:...
Я устанавливаю многоузловой кластер hadoop поверх виртуальных машин tow ubuntu. На следующем шаге я...
Я пытаюсь подключиться к Hive, используя beeline в кластере EMR (Kerberos включен), и мне интересно...
Чтобы записать данные из кадра данных pandas в паркет, я делаю следующее: df = pd.DataFrame(DATA)...