Прямого эквивалента нет.Если вам нужно сделать что-то подобное без Spark, я обычно использую Pig
. Для этого требуется как минимум две фазы уменьшения карты.Один для обработки данных, затем другой для сбора данных, которые вы на самом деле хотите
В маппере вы устанавливаете пустой для записи (или некоторый, однозначный ключ), а затем излучаете все значения, приводя их к одному редуктору.
В редукторе вы собираете все значения, которые хотите отсортировать или передать в коллекцию ограниченного размера.Я рекомендую TreeMap или Binary Heap, потому что они автоматически сортируются.Затем вы перебираете размер этой коллекции для значений K