Вопросы с тегом hdfs - PullRequest

Вопросы с тегом hdfs

0 голосов
1 ответ
0 голосов
1 ответ

Мне нужно создать озеро данных на AWS, но я не знаю, чем именно S3 отличается от HDFS? Я нашел...

Aziza Sbai El Idrissi / 11 июля 2019
0 голосов
0 ответов

Я знаю, что эта проблема чтения большого количества маленьких файлов в HDFS всегда была проблемой и...

Neel_sama / 10 июля 2019
0 голосов
1 ответ

Я установлен в Hadoop 3.0.2 в Ubuntu18, но когда я запускаю dfs.sh, он не показывает ни имени, ни...

marton mar suri / 09 июля 2019
0 голосов
0 ответов

Как обрабатывать столбец любого файла таблицы / csv, который содержит символ новой строки в pyspark...

Veeru Gandhad / 09 июля 2019
1 голос
1 ответ

Я учусь разрабатывать искровые приложения с использованием Scala. И я на первых шагах. У меня есть...

Anis / 09 июля 2019
0 голосов
1 ответ

$cat > import.txt import --connect jdbc:mysql://localhost/hadoopdb --username hadoop -password...

Vijaya Seetharaman / 09 июля 2019
0 голосов
0 ответов

Я пытаюсь прочитать байты из файла последовательности с определенным ключом в списке.Когда я...

hungryangry / 08 июля 2019
0 голосов
1 ответ

Если по одной теме я получаю сообщения в каком-либо формате, представляющем список идентичных...

UtterlyConfused / 08 июля 2019
2 голосов
1 ответ

Я пытаюсь запустить пример из книги Освоение Apache Spark 2.x. scala> val df = sc

Richard Rublev / 08 июля 2019
0 голосов
0 ответов

Попытка получить список всех каталогов в кластере Hadoop с файлами более 500000. Если родительский...

Dalsheen / 08 июля 2019
0 голосов
0 ответов

Я хотел бы сделать потоковую передачу Spark с Kafka на HDFS, как я могу сохранить rdds, сохраненные...

Roshan Fernando / 07 июля 2019
0 голосов
1 ответ

Я попытался запустить задание mapreduce в Hadoop 2.8.5, но оно продолжает работать. Состояние...

Lovish saini / 06 июля 2019
0 голосов
1 ответ

Я работаю над конвейером, который будет работать ежедневно.Он включает в себя объединение двух...

satish silveri / 05 июля 2019
1 голос
0 ответов

Пока мы пытаемся использовать Kafka Connect для HDFS Sink на основе статьи в блоге Confluent:...

Gopinathan K M / 05 июля 2019
1 голос
0 ответов

Мы используем Hadoop 2.7.3.HDFS Disk Balancer - это новая функция для Hadoop3.Каков наилучший...

msertacturkel / 05 июля 2019
0 голосов
3 ответов

Я пытаюсь сгруппировать значение (ключ, значение) с помощью apache spark (pyspark). Мне удается...

Logan / 05 июля 2019
0 голосов
0 ответов

Я запускаю искровое задание в кластерном режиме. Итак, мой драйвер скачивает файлы, добавляет их...

KAY_YAK / 04 июля 2019
0 голосов
1 ответ

У меня есть требование прочитать изображение из HDFS, выполнить некоторую обработку и сохранить...

hemshankar sahu / 04 июля 2019
0 голосов
0 ответов

Я использую HDP_3.0.1_sandbox в докере, запущенном на экземпляре Amazon EC2, и когда я пытаюсь...

Sergey Konotop / 04 июля 2019
2 голосов
0 ответов

У меня кластер hdfs и python на одной облачной платформе Google. Я хочу получить доступ к файлам,...

Asim / 04 июля 2019
0 голосов
2 ответов

Известен ли способ использования Hadoop api / spark scala для копирования файлов из одного каталога...

RData / 03 июля 2019
0 голосов
0 ответов

Я хочу отобразить каталог верхнего размера в формате hdf, включая его подкаталог.Пожалуйста,...

user8587005 / 03 июля 2019
1 голос
0 ответов

У меня есть классический координатор с входным событием на пути HDFS. <datasets> <dataset...

GreGGus / 03 июля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...