Вопросы с тегом hadoop - PullRequest

Вопросы с тегом hadoop

0 голосов
1 ответ

Контекст У меня есть две таблицы, к которым я присоединяюсь / объединяюсь как часть моих искровых...

naj / 24 августа 2018
0 голосов
1 ответ

As per distcp documentation -> If -pa is specified, DistCp preserves the permissions also...

satish sidnakoppa / 24 августа 2018
0 голосов
0 ответов

В настоящее время я использую Apache Parquet-Mr (Java) для обработки файлов Parquet. Я...

PRANAV SHRINIVAS PALANDE / 24 августа 2018
0 голосов
0 ответов

Я запускаю следующий файл hiveql со следующим содержимым set mapred.output.compress=true; set hive

Karthi / 06 июля 2018
0 голосов
1 ответ

Я обновил нашу систему HDP (Hortonworks Data Platform) с 2.5.2 до новейших версий (2.6.5). Все...

Phong Pham / 06 июля 2018
0 голосов
2 ответов

Я создал таблицу в улье. не внешний , структура таблицы остается такой же, как у файла, который...

Rohini Mathur / 06 июля 2018
0 голосов
2 ответов

Я писал данные на Hadoop и куст в формате паркета, используя спарк. Я хочу включить сжатие, но я...

User_qwerty / 06 июля 2018
0 голосов
1 ответ

Я пытаюсь импортировать данные из базы данных SAP Hana в hadoop с помощью команды импорта sqoop, но...

Manik / 06 июля 2018
0 голосов
1 ответ

Может ли Apache Impala установить / запустить на EC2 (а не на EMR) чтение данных из S3? Или для...

tooptoop4 / 06 июля 2018
0 голосов
2 ответов

Я очень новичок в Hadoop и пытаюсь использовать «вычисляемое» поле, как в SQL: SELECT...

Cliff / 05 июля 2018
0 голосов
0 ответов

У меня есть требование, когда мне нужно создать собственную команду Hbase Shell и вызвать метод...

arunkindra / 05 июля 2018
0 голосов
1 ответ

Я понимаю возможности Spark / Hadoop для работы с большими данными, но меня просят использовать их...

The Shoe Shiner / 05 июля 2018
0 голосов
0 ответов

Я получил это сообщение: WorkerSinkTask{id=hdfs-test-0} Sink task finished initialization and start...

Wiem Bel Hadj / 05 июля 2018
0 голосов
1 ответ

Я пытаюсь выполнить эту команду: aymenstien@aymenstien-VPCEH2Q1E:/usr/share/logstash$

Aymen Rahal / 05 июля 2018
0 голосов
0 ответов

Я создал блокнот в Jupyter SPARK_MAJOR_VERSION=2 PYSPARK_DRIVER_PYTHON=jupyter...

Nikolay Baranenko / 05 июля 2018
0 голосов
1 ответ

Итак, я сейчас пишу импала-запрос, который по существу группирует данные, основанные на нескольких...

Nathaniel Wihardjo / 05 июля 2018
0 голосов
2 ответов

Я новичок в Hadoop домене. Я хочу знать о системных требованиях для настройки среды hadoop. Мой...

Kowsalya Balakrishnan / 05 июля 2018
0 голосов
1 ответ

Я запускаю штормовую банку в кластере, где я настроил hadoop, kafka, штормовую группу когда я...

andani / 05 июля 2018
0 голосов
0 ответов

Вариант использования: Datastax DSE Cluster под управлением Cassandra, HiveMetastore (на основе...

tooptoop4 / 05 июля 2018
0 голосов
2 ответов

Когда я запускаю команду sqoop export из терминала, она работает нормально. Но если я запускаю ту...

user7481861 / 05 июля 2018
0 голосов
0 ответов

Я недавно преобразовал кластер HDP (2.6.2) в HDInsight 3.6 (ранее 3.5). С этого момента мои сиськи,...

Andrzej Ka / 04 июля 2018
0 голосов
2 ответов

Добрый день, коллеги. У меня большой набор данных (около 237 000 000 строк). Есть много столбцов....

0 голосов
0 ответов

У нас есть сервер улья для хранения больших данных, которые мы хотим использовать. Таблица хранится...

Mozzan / 04 июля 2018
0 голосов
1 ответ

У нас есть кластер hadoop с настроенным честным планировщиком. Мы привыкли видеть сценарий, когда в...

William R / 04 июля 2018
0 голосов
0 ответов

У меня есть несколько таблиц в Hive, каждый день новый csv-файл будет добавляться в расположение...

Hari / 04 июля 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...