предположим, что есть две сумки (набор с повторяющимися элементами в математике - не настоящие физические сумки) R и S с большим количеством синих и красных шариков внутри. как можно использовать алгоритм MapReduce для кластеризации (разделения) красных шаров в «R-мешок» и синих шаров в «S-мешках»
examle : R={redBall,blueBall,redBall,redBall ...}
S={blueBall,redBall,blueball,,redBall....}
Что такое функции Map и Reduce Input output + простое тело кода?
Картограф: input ()? Мейпер: Тело? Mapper (output)?
Уменьшить: input ()? Уменьшить: Основной код?
Уменьшить: Результат (R = {Все красные шары}, S = {Все синие шары})
я думаю, что ввод функции карты должен быть
key=name of Bags Value-list = Balls inside Bag
output (R,<RedBall,BlueBall ,...> )(S,<BlueBall,BlueBall,RedBall,...> )
затем сгруппируйте (в случайном порядке) и окончательный результат уменьшения
<R,RedBall RedBall,...> :it is R Bag
<S,BlueBall BlueBall,...> it is S Bag
Примечание : Сумки здесь не настоящие Сумки для сумок такие же, как и set = {}. с повторяющимися элементами (в книге Massive Dateset под названием «Сумка»)
Можно ли разбить на несколько пакетов Одно и то же имя?