Вопросы с тегом MapReduce

0 голосов

0 ответов

Как отправить mapreduce задание удаленно

Я настроил кластер hadoop2 и могу отправить пример задания wordcount с помощью команды hadoop jar....

ZhangKe877 / 01 апреля 2019

1 голос

1 ответ

как уменьшить количество контейнеров в запросе

У меня есть запрос, использующий много контейнеров и много памяти.(97% используемой памяти).Есть ли...

macieira / 01 апреля 2019

0 голосов

0 ответов

Ошибка Hadoop MRJob при попытке прочитать какой-либо файл в основной функции или mapper_init

Я сохранил некоторые идентификаторы в именах текстовых файлов trainTestID.txt. Мне нужны эти...

Javeria Habib / 30 марта 2019

1 голос

1 ответ

Улей на спарк - почему не «выбрать *» Spawn Spark приложение / исполнителей?

У меня есть настройка Hive (v2.3.4) на Spark (exec engine). Запускает приложение / исполнители...

tooptoop4 / 29 марта 2019

1 голос

1 ответ

считая жанры у свиньи

Я имею дело с набором данных movies.dat, предоставленным movielensdata.Первые 5 строк данных: 1:...

karabulut / 29 марта 2019

1 голос

0 ответов

hiveserver2 (на искре) - «mapred.FileInputFormat: общее количество входных файлов для обработки» - почему однопоточное?

У меня есть настройка Hive (v2.3.4) на Spark (exec engine).Моя внешняя таблица ульев имеет формат...

tooptoop4 / 29 марта 2019

0 голосов

0 ответов

Ошибка коммиттера S3 на этапе job_commit в MRAppMaster

Я использую коммиттер S3A (промежуточный коммиттер каталогов) со своим хранилищем объектов (не AWS)...

vippu / 29 марта 2019

2 голосов

1 ответ

проблема зависимостей в Apache Nutch

Попытка интегрировать Apache Nutch с Hadoop.После сборки файла apache-nutch-1.15.job, который...

vamsi krishna / 28 марта 2019

0 голосов

0 ответов

Неудачная эта попытка. Диагностика: Файл: .. не существует

Я новичок в Hadoop и хочу начать с количества слов, так как мне кажется, что это Hello World других...

Sofiane Aliouche / 28 марта 2019

0 голосов

0 ответов

Как повысить производительность, разрабатывая ETL с помощью Apache-Spark

Я разрабатываю ETL с помощью Apache-Spark.Я создаю в общей сложности 10 выходных CSV и у меня есть...

Juan Brugera Monedero / 26 марта 2019

1 голос

1 ответ

Как сохранить выходной сигнал Mapreduce без пары Key, Value?

Я пишу программу Mapreduce для обработки изображений Dicom.Целью этой программы Mapreduce является...

Vivek Singh / 25 марта 2019

0 голосов

1 ответ

Функция не возвращает значение

У меня есть задание для кодирования моей собственной функции карты, и я не уверен, почему она не...

exc22 / 24 марта 2019

0 голосов

1 ответ

Как прочитать строку JSON из строки в файле CSV?

Я новичок в MapReduce и MRjob, я пытаюсь прочитать CSV-файл, который я хочу обработать, используя...

Rabbir / 24 марта 2019

0 голосов

0 ответов

Массовая загрузка Hbase прервана, некоторые файлы еще не загружены

У меня есть работа, где я загружаю около 5000 файлов.Я получаю ошибку ERROR [main] mapreduce

behold / 24 марта 2019

1 голос

1 ответ

Как я могу получить путь к файлу для сегмента данных в Mapper задания Mapreduce?

У меня есть задание mapreduce, где путь ввода файла: /basedirectory/*/*.txt Внутри базового...

behold / 24 марта 2019

0 голосов

0 ответов

Картограф, обрабатывающий разное количество строк

Итак, сегодня я заметил странное поведение моего кода уменьшения карты.Потратил 3 часа, пытаясь...

Parth Tamane / 22 марта 2019

0 голосов

0 ответов

Hadoop MapReduce установить рекурсивный ввод - метод не найден

Я хочу прочитать входные данные из каталога, где есть другие каталоги и файлы внутри этих...

Pleasant94 / 22 марта 2019

0 голосов

0 ответов

Mapreduce как связать Mapper >> Редуктор >> Редуктор

У меня проблема с цепочкой Mapper >> Редуктор >> Редуктор Это мои данные: Dpt.csv EmpNo1, DeptNo1...

Parth Tamane / 22 марта 2019

0 голосов

1 ответ

Обработка данных MapReduce Spark с помощью rdd (scala)

У меня есть большие данные, и я хочу использовать mapRuduce на этих данных, и я ничего не нашел для...

Pablo Pablo / 22 марта 2019

0 голосов

0 ответов

Как отправить данные и код в JAVA для выполнения в экосистеме Hadoop

Я довольно новичок в Hadoop, и мне довольно сложно понять все.Я вроде концептуальная карта...

TDRS / 21 марта 2019

1 голос

0 ответов

ОШИБКА сжатия Hadoop: java.lang.UnsatisfiedLinkError: org.apache.hadoop.util.NativeCodeLoader.buildSupportsSnappy () Z

Когда я запускаю Apache Kylin на Hadoop, я встретил следующую ошибку, связанную с Hadoop MapReduce:...

Yanwen Lin / 20 марта 2019

0 голосов

1 ответ

Предложения, необходимые для увеличения использования контейнеров пряжи в нашем кластере обнаружения

Текущая настройка у нас есть наш кластер обнаружения из 10 узлов. Каждый узел этого кластера имеет...

akash sharma / 20 марта 2019

1 голос

0 ответов

Ошибка записи в OrcNewOutputFormat с использованием MapR MultipleOutputs

Мы читаем данные из файлов ORC и записываем их обратно в формат ORC и Parquet, используя...

Aniruddha / 19 марта 2019

1 голос

1 ответ

Как получить средний результат, используя программирование уменьшения карты?

Я использую Mongodb, чтобы попытаться определить средний пробег в моей коллекции автомобилей,...

Abdi / 19 марта 2019

2 голосов

1 ответ

Выгода от использования MapReduce вместо Spark сегодня?

Я настраиваю кластер Hadoop для тестирования / PoC. Есть ли сегодня что-нибудь, что нельзя сделать...

Alv / 19 марта 2019