Я ищу проект Hadoop, основанный на исследованиях / реализации, и наткнулся на список, размещенный на вики-странице - http://wiki.apache.org/hadoop/ProjectSuggestions. Но эта страница была в последний раз обновлена в сентябре 2009 года. Итак, я 'Я не уверен, что некоторые из этих идей уже были реализованы или нет.Меня особенно интересовала «Оптимизация сортировки и перемешивания в среде MR», в которой говорится о «объединении результатов нескольких карт на стойке или узле до перемешивания. Это может сократить объем поисков и промежуточное хранилище».
Кто-нибудь пробовал это раньше?Это реализовано в текущей версии Hadoop?