Я получаю файлы в режиме реального времени в формате hdf, и они имеют одинаковое соглашение об...
После переноса моих данных (предположим, таблицы) в HDFS я понятия не имею, как реплицируются мои...
Предположим, у меня есть 4-5 ВСЕХ БОЛЬШИХ таблиц (данные в ТБ), и я хочу объединить их в улье....
Я всегда предполагал, что ответ - да, HDFS реализована поверх хранилища Hadoop Key-Value, но я не...
Я использую Flume для передачи локального файла в сток HDFS, ниже мой конф: # Name the components...
Может ли кто-нибудь указать мне URL-адрес, который объясняет, как данные передаются из S3 в память...
В моем rdd есть два строковых элемента: «53 45 61», «0 1 2». Я хотел бы сжать и отобразить его...
Я пытаюсь экспортировать данные из местоположения hdfs в пользовательскую схему Greenplum (не по...
Я пытаюсь отслеживать некоторые метрики для приложений Java. Приложение работает на Hadoop (пряжа),...
Я устанавливаю Hadoop в Windows 7 64bit с помощью Cygwin.После того, как я успешно отформатировал...
У меня есть рабочий процесс oozie, который выполняет действие куста (например, вставить таблицу...
Мне нужно писать в Hadoop около 150B вложенных записей Json в день (используя Spark Java), Что...
Ниже id образца набора данных для транзакций, в которых "t_id" и "parent_id" имеют отношения...
В настоящее время я выполняю следующую команду sqoop merge --new-data / home / part1 / part-m-00000...
Я пытаюсь импортировать данные из Memsql в HDFS, используя Sqoop в прямом режиме.Моя команда Sqoop...
Хотел узнать, как проверить отсутствующие записи в Hive, когда данные загружаются из Oracle из-за...
Вот мой запрос вставить каталог перезаписи '/ myloc / output' select * from emp, где eid 345; Если...
У меня есть MongoDB и Spark, работающие на Zeppelin, которые используют одну и ту же HDFS.MongoDB...
Я пишу Spark Scala-приложение с SBT, и когда я просто запускаю его как Scala-приложение, оно...
Я загружаю данные из твиттера, используя flume, в папку hdfs. Команда flume-ng успешно выполнена и...
Я новичок в Giraph и hadoop. Я пытаюсь скомпилировать giraph, используя maven. Я пытался...
Я хочу проанализировать журнал драйвера моего потокового приложения Spark (запущенного в режиме...
job.setNumReduceTasks(0) приводит к работе только на карте означает ли это, что промежуточная фаза...
У меня есть таблица из 100000 записей, и я хочу импортировать 1000 случайных записей из этой...
Я написал небольшую карту, чтобы найти вторую по величине зарплату среди набора данных. Я верю, что...