MapReduce для кластеризации красных и синих шаров в два пакета - PullRequest
0 голосов
/ 30 мая 2020

предположим, что есть две сумки (набор с повторяющимися элементами в математике - не настоящие физические сумки) R и S с большим количеством синих и красных шариков внутри. как можно использовать алгоритм MapReduce для кластеризации (разделения) красных шаров в «R-мешок» и синих шаров в «S-мешках»

 examle :    R={redBall,blueBall,redBall,redBall ...}
             S={blueBall,redBall,blueball,,redBall....}

Что такое функции Map и Reduce Input output + простое тело кода?

Картограф: input ()? Мейпер: Тело? Mapper (output)?

Уменьшить: input ()? Уменьшить: Основной код?

Уменьшить: Результат (R = {Все красные шары}, S = {Все синие шары})

я думаю, что ввод функции карты должен быть

key=name of Bags Value-list = Balls inside Bag
output (R,<RedBall,BlueBall ,...> )(S,<BlueBall,BlueBall,RedBall,...> ) 

затем сгруппируйте (в случайном порядке) и окончательный результат уменьшения

<R,RedBall  RedBall,...> :it is R Bag

<S,BlueBall BlueBall,...> it is S Bag

Примечание : Сумки здесь не настоящие Сумки для сумок такие же, как и set = {}. с повторяющимися элементами (в книге Massive Dateset под названием «Сумка»)

Можно ли разбить на несколько пакетов Одно и то же имя?

...