Вопросы с тегом MapReduce

0 голосов

1 ответ

Пользовательские журналы пустые

У меня есть простая программа mapreduce с одним заданием, но задание не выполняется. Я хочу...

Sharon / 10 июля 2019

0 голосов

1 ответ

Использование Apache Spark для быстрых (<5 секунд) вычислений на больших матрицах

Моя команда собирается создать приложение, и я исследую некоторые распределенные вычислительные...

gacharya / 10 июля 2019

0 голосов

0 ответов

Медленные корреляционные вычисления в Apache Hive

Я рассматриваю возможность использования Apache Hive в качестве бэкенда для приложения, которое я...

gacharya / 09 июля 2019

0 голосов

0 ответов

Является ли MapReduce Turing завершенным?

У меня есть два вопроса относительно инфраструктуры MapReduce и полноты Тьюринга: Прежде всего,...

Diego Chinellato / 09 июля 2019

0 голосов

0 ответов

Apache HBase - вычислить коэффициент корреляции для большой, широкой матрицы

У меня большая, широкая таблица, хранящаяся в Apache Hbase для случайных поисков. Таблица...

gacharya / 09 июля 2019

0 голосов

0 ответов

Прогресс карты Mapreduce внезапно резко упал. Так же, как map100% к карте67%

Я использовал потоковую передачу hadoop для запуска кода mapreduce. Это мой статус бега 19/07/08...

jiuxian77 / 08 июля 2019

0 голосов

0 ответов

Есть ли система, которая использует все три абстрактные модели в распределенной системе?

У меня есть вопросы- Существует ли какая-либо система, которая использует все три абстрактные...

Abhinav Rawat / 08 июля 2019

0 голосов

1 ответ

Задание Hadoop продолжает выполняться, и контейнер не выделен

Я попытался запустить задание mapreduce в Hadoop 2.8.5, но оно продолжает работать. Состояние...

Lovish saini / 06 июля 2019

0 голосов

0 ответов

Невозможно развернуть файл JAR в кластере

spark-submit --class spark_deploy1.spark_deploy1 --master local[*]...

Naresh Naresh / 05 июля 2019

0 голосов

0 ответов

Исправление вывода TF.IDF

Я написал код алгоритма TF.IDF для pyspark, основанный на процессе MapReduce.Я хочу, чтобы мой...

Liri Rozenthal / 03 июля 2019

0 голосов

1 ответ

В чем разница между mapreduce.job.running.reduce.limit и mapred.reduce.tasks

Мы используем Hadoop 2.7.1, и я обнаружил, что ниже 2 параметра установлены в некотором...

gfytd / 02 июля 2019

0 голосов

0 ответов

MapReduce log4j исключение

Мои задания сокращения карты не выполняются после обновления hadoop до 3.0 с ошибкой log4j...

Manoj Sreekumar / 01 июля 2019

0 голосов

1 ответ

В программе уменьшения количества слов на карте необходимо выбрать файлы, в которых есть слова

Я читаю несколько входных файлов для проблемы подсчета слов. Примеры имен файлов: file1.txt file2

Rakesh R / 01 июля 2019

1 голос

2 ответов

пользовательские функции уменьшения в кроссфильтре на 2 поля

Мои данные выглядят так field1,field2,value1,value2 a,b,1,1 b,a,2,2 c,a,3,5 b,c,6,7 d,a,6,7...

Chapo / 01 июля 2019

0 голосов

1 ответ

Разбиение набора данных на куски с помощью каскадирования

Обеспечивает ли каскадирование способ разбиения набора данных на куски? Например, каждый чанк будет...

edwga / 30 июня 2019

0 голосов

0 ответов

Apache Hive ударил между

Я новичок в Apache Hive. Я попытался выполнить запрос на Apache Hive. Но ударил где-то посередине....

Lovish saini / 29 июня 2019

1 голос

0 ответов

Почему функция Reduce в CouchDB не возвращает массив?

Моя функция Reduce в CouchDB создана для возврата массива, но когда я запускаю запрос Couch, я...

kailashsharan / 28 июня 2019

0 голосов

1 ответ

Java Mapreduce - получение имен файлов с совпадениями и печать в выходной файл

Привет Я пытался придумать модифицированную версию стандарта WordCount v1.0 при этом я читаю все...

Optivery Good / 28 июня 2019

1 голос

1 ответ

размер перекрестного фильтра на 2 поля

Мои данные выглядят так field1,field2,value1,value2 a,b,1,1 b,a,2,2 c,a,3,5 b,c,6,7 d,a,6,7 У меня...

Chapo / 28 июня 2019

2 голосов

0 ответов

Как определить строку в моем CSV-файле, вызывающую сбой задания в моей карте массовой загрузки, в Apache Phoenix

Я пытаюсь загрузить CSV-файл, хранящийся в формате hdf, с примерно 140 миллиардами строк, с помощью...

cmatic / 27 июня 2019

1 голос

2 ответов

Серверы региона HBase продолжают сбой при импорте TSV

Пытаюсь загрузить вкладку разделенный файл HDFS ( 3.5G ) с 45-миллионной записью в HBASE, используя...

Exorcismus / 26 июня 2019

0 голосов

1 ответ

Как исправить функции TF.IDF на pyspark?

Я пытаюсь разработать процесс TF.IDF для pyspark с помощью MapReduce (платформа - Databricks)

Liri Rozenthal / 26 июня 2019

0 голосов

1 ответ

Функции MapReduce

Я работаю над проектом spark в IDE затмения, используя scala Мне нужна помощь с этой проблемой...

Amel ha / 25 июня 2019

0 голосов

0 ответов

Конфигурация или код задания Spark или Map Reduce для копирования или записи файла с использованием атрибута --storage-class

У меня есть ТБ данных, которые хранятся с использованием --storage-class = STANDARD в одном месте...

Vipul khalasi / 24 июня 2019

0 голосов

1 ответ

Суммируйте данные из одного кадра данных в другой

Я бы хотел помочь вам в следующем. В моей работе у меня есть два кадра данных. Первый, называемый...

Ângelo / 22 июня 2019