Да, Hadoop гарантирует, что все одинаковые клавиши будут переданы в один и тот же редуктор. Это достигается с помощью функции Partition, которая объединяет ключи с помощью хэш-функции.
Для получения дополнительной информации о процессе разбиения взгляните на это: Данные разбиения
В частности, речь идет о том, как разные преобразователи, которые обрабатывают один и тот же ключ, гарантируют, что все ключи с данным значением окажутся в одном разделе и, следовательно, будут обрабатываться одним и тем же редуктором.