У меня есть Java Map / Reduce Job, которая работает с большими блоками текста и выполняет...
Я искал на разных форумах, но не нашел точного ответа. Документация по Pymongo очень плохая, когда...
У меня есть большой файл Hadoop-LZO (около 26 ГБ), который нужно построчно обрабатывать и выводить...
Я запускаю улей на mapreduce, некоторые мапперы работают до 8 часов (в основном последние несколько...
Из Hadoop. Полное руководство Весь процесс показан на рисунке 7-1. На самом высоком уровне Есть...
Я бы хотел получить новейшие документы на основе поля timestamp, сгруппированного по некоторым...
Я использую кластер Hadoop & YARN с одним узлом. Все демоны hadoop и yarn запускаются в этом узле....
Как часть моих исследований, мы недавно начали изучать MongoDB, и поэтому я очень молод в этой...
Новое в Hadoop!Я пытаюсь изменить код программы wordcount для вывода только тех слов, которые...
Везде в Google ключевое различие между Spark и Hadoop MapReduce указано в подходе к обработке:...
У меня есть файл 5 ГБ. Я использую простую карту для уменьшения количества слов. размер блока...
У меня есть программа mapreduce, работающая на Hadoop-2.9 с 1 ведущим и 5 ведомыми.В этой программе...
У меня в настоящее время есть корзина на AWS S3, давайте просто для простоты назовем ее «bucketX».в...
Я сталкиваюсь с этой проблемой каждый раз, независимо от набора данных .. Я загрузил свой набор...
Я использовал AWS EMR (потоковую передачу Hadoop) для обработки входных данных 648 МБ в 9 текстовых...
Я работаю с R Hadoop.У меня есть строка, которую я сопоставил, устанавливая каждое слово в качестве...
Основная проблема в том, что программа запускает Exception in thread "main" org.apache
Я немного смущен количеством картографов, порожденных заданием MapReduce. Я читал во многих местах,...
Я понимаю, что CouchDB не предназначен для использования реляционной базы данных, но, пожалуйста,...
В документации MongoDB, в разделе MapReduce можно прочитать Функция Reduce должна возвращать объект...
Я попытался запустить программу mapReduce «подсчет слов» с потоковой передачей Hadoop. Мой код для...
Рабочий процесс Oozie запускает Java-класс Hadoop Map Reduce.В свой проект Eclipse я добавил...
Я вижу, что ошибка "java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO $...
У меня есть небольшой файл JAR, который является правильным, потому что я проверил его на другом...
почему «set» имеет только один элемент, в то время как, например, он должен иметь 4 элемента для...