Пытаюсь обработать большие объемы данных порядка 5-10 миллионов. Я использую Mapper в...
У меня около 2 миллионов записей, каждая из которых содержит около 4 строковых полей, которые...
Для мониторинга приложения с помощью CouchDB мне нужно суммировать поле моих данных (например,...
Я ищу способ загрузить весь текст файла в мою карту. Ни одна строка за раз, как TextInputFormat...
Я изо всех сил пытаюсь получить четкое представление о том, как работает карта и когда ее...
просто интересно, что означает следующая команда? так трудно гуглить темы, связанные со свиньей:...
Есть ли место, где я могу найти, как настроить плагин hadoop eclipse, который поставляется вместе с...
В настоящее время я внедряю параллельный метод on для цикла hasoop, чтобы выполнить итерацию числа...
У меня есть приложение для анализа журналов.Когда пользователи загружают файл, он автоматически...
Я работаю над программой сокращения карт и думал о разработке вычислений в форме, где a1, b1 - это...
Часть 1: У меня есть коллекция (студент): { sname : "", studentId: "123" age:...
Я работаю на кластере Hadoop с 8 узлами и пытаюсь выполнить простое потоковое задание с указанной...
Я создаю приложение для людей, посещающих мероприятия. Мне нужно создать объект Ticket для...
У меня есть такие документы в моей CouchDB: { "_id":...
Мне нужно сделать несколько тяжелых вычислений машинного обучения. У меня есть небольшое количество...
В настоящее время я работаю над заданием MapReduce, в котором я использую только маппер без...
Я смотрю на этот график ... http://www.mongodb.org/display/DOCS/MongoDB,+CouchDB...
Я пытаюсь запустить задание Disco с использованием map и сократить функции, которые...
Я хочу эффективно отсортировать большой набор данных (то есть с пользовательским разделителем, как...
У меня есть функция, которую нужно вызывать для большого количества файлов (1000). Каждый из них не...
Я новичок в hadoop и учусь на нескольких примерах.В настоящее время я пытаюсь передать файл со...
В настоящее время я пытаюсь выяснить, когда вы запускаете задание MapReduce, что происходит,...
Я начинаю использовать mrjob для Python, чтобы преобразовать некоторые из моих давно работающих...
У меня есть большое количество статических данных, которые должны обеспечивать произвольный доступ....
Мне нужно сгенерировать вектор униграмм, то есть вектор всех уникальных слов, которые появляются в...