Ссылка: Rumen - это инструмент для извлечения и анализа данных, созданный для MapReduce.Румен добывает журналы JobHistory для извлечения значимых данных и сохраняет их в легко анализируемом формате.Румен выполняет статистический анализ информации, извлеченной из журналов JobHistory, что может с помощью других инструментов выполнять задачи, такие как моделирование, эмуляция и сравнительный анализ.Rumen формирует основу для GridMix (v3) и Mumak.
Ссылка: Другие новые модули вклада включают Rumen (MAPREDUCE-751) и Mumak (MAPREDUCE-728), инструменты для моделирования MapReduce.Они предназначены для совместной работы: Rumen извлекает данные о заданиях из исторических журналов, которые затем использует Mumak для моделирования приложений и кластеров MapReduce в кластере.Gridmix3 также предназначен для работы со следами рубца.Анализатор журнала заданий - это еще один инструмент, который предоставляет информацию об использовании кластера MapReduce (HDFS-459).
Пример Руб данные находятся в SVN.К вашему сведению, FUI, Rumen и Mumak являются модулями вклада, и доступной документации не так много.Вот хорошая статья о GridMix .