Найти пересечение 2 больших отсортированных массивов, используя MapReduce - PullRequest
2 голосов
/ 16 декабря 2011

Как найти пересечение 2 больших отсортированных массивов с помощью MapReduce

1 Ответ

2 голосов
/ 16 декабря 2011

Я не думаю, что MapReduce - правильный инструмент;так как ваши массивы отсортированы, вы можете сделать то, что равноценно слиянию, за исключением того, что вместо сбора всех результатов вы сохраняете только те, которые появляются в обоих массивах.Хороший линейный алгоритм.Но так как вы спросили ...

Часть Map MapReduce принимает набор пар (ключ, значение).Поэтому укажите единицу, где каждая пара соответствует элементу в одном из массивов, причем ключом является значение элемента, а значение указывает, из какого массива он получен.Затем уменьшите выбрасывание любого ключа, который не имеет значения из обоих массивов.Я оставлю дело с дубликатами в качестве упражнения.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...