Войти

Запомнить

Регистрация

PullRequest

Лента
Топ
Теги
Новая

Новая

Arun K 17 ноября 2011 26

Как данные распределяются между узлами?

2 голосов

Arun K / 17 ноября 2011

Мне было интересно изменить способ разделения входных данных заданий на конкретные узлы.

Я просмотрел код Hadoop в JobInprogress, но не смог узнать, как происходит фактическое распределение.

Как входные разбиения задания распределяются по узлам кластера?

Какие файлы Hadoop мне нужны, чтобы понять распределение?

Hadoop
облако
распределенные вычисления

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

1 голос

Praveen Sripati / 17 ноября 2011

Каждый формат ввода, такой как MultiFileInputFormat , реализует метод InputFormat # getSplits () , в котором рассчитываются входные сплиты.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.

Похожие темы

Реализация клиент-серверного приложения для распределенных вычислений
Cloudsim несколько центров обработки данных
Одна подсеть в двух подключенных центрах обработки данных
Абстракция для распределенного CancellationToken
Реализация базового метода DHT по моделированию облачной системы (Python)
Чем «Данные как услуга» (DaaS) отличаются от «Хранилище как услуга» (StaaS)?
А.И .: Как бы я обучил нейронную сеть на нескольких машинах?
Служба распределенного окна
C ++: Идея распределенной обработки клиент-сервер: закрыть соединение после отправки данных, снова открыть после завершения задачи?
В поисках предмета по вопросам масштабируемости и / или дизайна веб-приложений

...