Мне нужно массово обновить хранилище данных с помощью файла CSV (250 000 строк) с использованием...
В новом API (apache.hadoop.mapreduce.KeyValueTextInputFormat), как указать разделитель...
У нас есть проблема с нашей структурой данных в SQL Server, поскольку мы упорядочиваем по...
Я определил свой собственный формат ввода следующим образом, который предотвращает разбиение файла:...
Я пытаюсь отказаться от необходимости использования метода setOutputValueGroupingComparator для...
Мой редуктор выглядит следующим образом public static class Reduce extends MapReduceBase implements...
В попытке выучить Hadoop я практикую нерешенные вопросы программирования из книги «Hadoop в...
У меня есть входные данные, которые выглядят следующим образом: 3070801,1963,1096,,"BE"...
Как мне изменить запрос PostgreSQL на вызов msonodb bson? У меня есть тот же вариант использования,...
Я много искал, но не смог найти решение этой проблемы. На самом деле файл, к которому я хочу...
В книге Hadoop говорится, что мы можем указать размер блока для каждого файла во время создания...
Я пытаюсь провести анализ данных на Amazon Elastic MapReduce.Шаг mapper - это скрипт на python,...
1) У меня есть задание Hadoop только для карт, которое передает данные в кластер Cassandra. 2)...
Я запускаю потоковое задание Hadoop, в котором есть только картографы, но нет редукторов.Я даю этой...
Я хочу обработать все данные в семействе столбцов в задании MapReduce. Заказ не важен. Подход...
Я использую: http://code.google.com/p/appengine-mapreduce/ и начиная с демонстрационного приложения
Я пытаюсь отправить два файла в редуктор hadoop. Я пробовал DistributedCache, но все, что я положил...
В RavenDB у меня есть документ, который выглядит так: public class SystemNotification { public...
У меня вопрос: должен ли я сам заботиться о многопроцессорности в моем маппере (читать задачи из...
У меня странная проблема с уменьшением карты MongoDB (2.0.2). Итак, история выглядит так: У меня...
В моем текущем проекте я использую две базы данных. Экземпляр MongoDB, собирающий данные от разных...
При выполнении задания hadoop в псевдоноде задание не выполняется и его убивают. Ошибка: Задача...
Я ищу способ обновить каждый документ в коллекции под названием "posts". Посты периодически...
Я пытаюсь написать функцию mapreduce для сбора статистики из mongodb. Однако .. Мой товарищ по...
У меня есть задание mapreduce, которое запускает коллекцию постов и вычисляет популярность для...