У меня есть этот вывод из действия оболочки: SHELL_OUTPUT='John,28,1,0 Jack,32,0,15 Mary,45,23...
Я пытаюсь настроить H20 на Hadoop, поэтому у нас есть кластер Hadoop HDP2.5, и я скачал и...
Я хочу загрузить данные из файла Excel в HDFS, используя Spark Session 2.2. Вот ниже мой Java-код и...
У меня есть таблица A: id colA colB(Chained) 1 11 17 2 22 41 3 44 42 4 82 43 5 17 13 6 20 85 7 26...
У меня есть серия сценариев Pig, которые преобразуют сотни миллионов записей из нескольких...
Я пытаюсь импортировать таблицу с sqoop; Я использую 4 картографа. Проблема в том, что время...
Я следовал следующему руководству: https://docs.hortonworks.com/HDPDocuments/HDP2/HDP-2.6
Я новичок в oozie и у меня есть сценарий использования, в котором нам нужно было бы установить...
Я пытаюсь вставить данные в улей. Для этого я использую Presto. Вот мой запрос: insert into...
С помощью команды hadoop fs -put данные последовательно поступают в кластер. Но как выгрузить...
Я установил Hadoop на Windows в соответствии с этой статьей и теперь могу запустить тестовое...
Вопрос В автономном кластере Flink, работающем на сервере, я разрабатываю потоковое задание Flink в...
Я пытаюсь загрузить данные из обычной таблицы в многораздельную таблицу Hive. Вот мой обычный...
Я хочу использовать Apache Solr для импорта или индексирования таблиц Hive, хранящихся в файлах...
Привет всем, Просто пытаюсь понять поток тестовой программы от одного из Примеры. Я добавил...
Я искал различия между Spark и MapReduce, и все, что я действительно нашел, это то, что Spark...
У меня есть текстовый файл с 6 столбцами, и я заинтересован в третьем и четвертом столбце, Город и...
У нас есть кластерная версия Hadoop HDP - 26, на redhat-машинах версия 7.x Мы запускаем следующую...
Когда я запускаю приложение Spark на EMR, в чем разница между добавлением конфигов в файл spark /...
Как установить диапазон для предложения limit в кусте, я пробовал приведенный ниже запрос, но не...
Я новичок в Mahout и Random-Forest. Я хочу классифицировать свой набор данных и построить случайный...
Как распределенная копия (distcp) работает между двумя кластерами при сбое NameNode (NN) в...
Мое впечатление от очень простых тестов между двумя узлами состоит в том, что тот факт, что HDFS...
Я получаю "Неоднозначную ссылку на столбец" запрос: SELECT stage.acct_nbr FROM (SELECT * FROM mem...
У меня есть несколько терабайтных данных, и я хочу проанализировать их в Qt. В локальной системе...