Вы могли бы также рассмотреть чтение рабочих процессов корпоративных данных Пако Натана в каскадном режиме.Вы можете запустить PMML на вашем кластере, экспортированном из R или SAS.Это не должно сказать ничего плохого о Mahout в действии, авторы проделали большую работу и явно приложили много времени и усилий, чтобы сделать его поучительным и интересным.Это скорее предложение выйти за пределы Махута.В настоящее время он не получает такой тяги, как если бы он был более удобным для пользователя.
В сущности, пользовательский интерфейс Mahout немного изменчив и не дает четкого представления о том, как разрабатывать и обновлять интеллектуальные системы и их жизненные циклы, IMO.Mahout на самом деле неприемлем для академиков, они с большей вероятностью используют Matlab или R. В документах Mahout реализация случайного леса едва работает, и в документах есть ошибочные примеры и т. Д.подпрограммы Mahout зависят от алгоритма.В настоящее время я не вижу, чтобы Mahout никуда не уходил, опять же, IMO.Надеюсь я ошибаюсь!
http://shop.oreilly.com/product/0636920028536.do