Вопросы с тегом hadoop-перегородки - PullRequest

Вопросы с тегом hadoop-перегородки

0 голосов
2 ответов

У меня есть таблица, разделенная на event_date, и по какой-то причине, когда я вставляю данные во...

phenderbender / 12 ноября 2019
0 голосов
1 ответ

Какой из них лучше (с точки зрения производительности и работы в долгосрочной перспективе) в...

amr007 / 03 ноября 2019
0 голосов
1 ответ

Я запускаю сценарий pyspark, где при каждом запуске сценария я сохраняю некоторые данные в корзину...

Cards14 / 23 октября 2019
2 голосов
1 ответ

Я пытаюсь передать список дат в качестве параметра в мой запрос улья. #!/bin/bash echo...

vikrant rana / 10 июля 2019
0 голосов
1 ответ

Я читаю несколько входных файлов для проблемы подсчета слов. Примеры имен файлов: file1.txt file2

Rakesh R / 01 июля 2019
0 голосов
0 ответов

Я знаю, как работает NameNode, узел вторичного имени. Просто любопытно, когда контрольная точка...

grep / 28 июня 2019
1 голос
1 ответ

Мое требование - объединить существующие часовые разделы с ежедневными разделами для всех дней. Мой...

bala chandar / 25 июня 2019
1 голос
1 ответ

Невозможно получить доступ к таблице кустов в Impala, в которой есть раздел, созданный в столбце...

Umer / 19 мая 2019
0 голосов
0 ответов

Я реализовал функцию Map-Reduce, чтобы извлекать документы из одной коллекции, фильтровать ее и...

iMDroid / 02 марта 2019
0 голосов
0 ответов

Предполагается, что местоположение S3 с необходимыми данными имеет вид:...

pippa dupree / 01 марта 2019
0 голосов
0 ответов

Я использую CombineFileInputFormat для действия по уменьшению карты для обработки небольших файлов...

jp1518 / 03 января 2019
0 голосов
1 ответ

Мы работаем над созданием большого кластера из 100 узлов с хранилищем 300 ТБ.Затем мы должны...

Shafiq / 27 декабря 2018
0 голосов
0 ответов

Я пытаюсь создать динамическое разбиение на основе двух столбцов и загрузить данные из файла,...

sabby / 19 декабря 2018
0 голосов
0 ответов

Я сравниваю два файла A & B и извлекаю столбцы из A, которых нет в B, и добавляю их в B. Когда...

user2316771 / 04 декабря 2018
0 голосов
1 ответ

Я создал секционированную таблицу Hive, используя следующий запрос CREATE EXTERNAL TABLE...

user2316771 / 03 декабря 2018
0 голосов
0 ответов

Справочная информация: Я работаю с клиническими данными с большим количеством различных .csv/.txt...

cph_sto / 22 ноября 2018
0 голосов
1 ответ

Предположим, что приведенная ниже таблица: в качестве схемы: ID,NAME,Country и my partition key is...

Varshini / 28 октября 2018
0 голосов
1 ответ

В моих таблицах кустов 1500 разделов, но выполнение запроса занимает больше времени, чем ожидалось

Naveen Gupta / 22 октября 2018
0 голосов
1 ответ

java.sql.SQLException: ошибка при обработке оператора: FAILED: ошибка выполнения, код возврата 2 из...

Ankit / 19 октября 2018
0 голосов
1 ответ

Я создал два фрейма данных в pyspark из моей таблицы улья: data1 = spark.sql("""...

vikrant rana / 04 октября 2018
0 голосов
0 ответов

С здесь : Согласно руководству по определению hadoop "Внутри каждого раздела фоновый поток...

TheeNinjaDev / 01 октября 2018
0 голосов
1 ответ

В работе Map-Reduce я использую пять разных файлов, где в моем наборе данных содержатся значения в...

Mohit Raja / 14 сентября 2018
0 голосов
1 ответ

Я выполняю два задания примера подсчета Word в одном кластере (я запускаю hadoop 2.65 локально с...

Or Raz / 11 сентября 2018
0 голосов
1 ответ

Я создал таблицу с интервалом emp_bucket в 4 сегмента, сгруппированных по столбцу зарплаты

Sunil / 12 июня 2018
0 голосов
1 ответ

Я работал над одним решением и обнаружил, что в некоторых конкретных случаях куст insert overwrite...

Gaurang Shah / 31 мая 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...