Стоит ли покупать Mahout в действии, чтобы освоиться с Mahout, или есть другие лучшие источники? - PullRequest
11 голосов
/ 22 декабря 2010

Я в настоящее время очень случайный пользователь Apache Mahout , и я рассматриваю возможность покупки книги Mahout в действии . К сожалению, мне очень трудно понять, насколько стоит эта книга - и я вижу, что это книга Программа раннего доступа (и поэтому в настоящее время доступна только в виде бета-версии e книга), я не могу сам посмотреть в книжном магазине.

Кто-нибудь может порекомендовать это как хорошее (или менее хорошее) руководство по быстрому освоению с Mahout и / или другими источниками, которые могут дополнить сайт Mahout?

Ответы [ 6 ]

21 голосов
/ 23 декабря 2010

Говоря как коммиттер Mahout и соавтор книги, я думаю, что это того стоит. ; -)

А если серьезно, над чем ты работаешь? Может быть, мы можем указать вам на некоторые ресурсы.

Некоторые аспекты Mahout просто сложно понять самостоятельно. Мы усердно работаем над ответами на вопросы в списке рассылки, но это может помочь получить пример кода и план действий. Без этого трудно даже задать хороший вопрос.

11 голосов
/ 24 декабря 2010

Также соавтор здесь. Быть «изо рта лошади» - это, пожалуй, самая полная запись для самого Махута. Там есть несколько хороших постов в блоге, и, конечно, множество хороших книг по машинному обучению в целом (мне нравится Коллективный разум в действии в качестве широкого введения). У user@mahout.apache.org есть несколько человек, которые говорят, что им нравится книга FWIW, как и книжные форумы (http://www.manning -sandbox.com / forum.jspa? forumID = 623) Я думаю, что вы можете вернуть электронную книгу если это не совсем то, что вы хотели. Он определенно состоит из 6 глав по кластеризации.

3 голосов
/ 25 марта 2013

На данный момент лучший там. Вероятно, такой же зрелый, как продукт. Некоторые аспекты лучше, чем другие, понимание базовой реализации хорошо, практических методов, чтобы начать работать на Linux, Mac OSX и т. Д. Для новичков не так много. Определение четкой стратегии о том, как поддерживать рекомендацию обновленным, сомнительно. Примеры производства довольно тонкие. Хорошо, как отправная точка, но вам нужно гораздо больше. Авторы делают все возможное, чтобы помочь, но это довольно новый продукт. В общем, да, купи это.

3 голосов
/ 28 августа 2011

есть много частей книги, которые устарели, версия или две позади того, что является текущим.Кроме того, в тексте есть несколько ошибок, особенно в примерах.это может усложнить задачу при попытке воспроизвести обсуждаемые результаты.

Кроме того, вы должны знать, что наиболее зрелая часть mahout, система рекомендаций, вкус, не распределена.Я не совсем уверен, почему это упаковано с остальной частью mahout.это скорее жалоба на программный пакет, чем на сам mahout.

2 голосов
/ 27 августа 2012

Я получил книгу несколько недель назад. Настоятельно рекомендуется. Авторы также очень активны в списке рассылки, и в этом проекте много классной энергии.

0 голосов
/ 23 августа 2013

Вы могли бы также рассмотреть чтение рабочих процессов корпоративных данных Пако Натана в каскадном режиме.Вы можете запустить PMML на вашем кластере, экспортированном из R или SAS.Это не должно сказать ничего плохого о Mahout в действии, авторы проделали большую работу и явно приложили много времени и усилий, чтобы сделать его поучительным и интересным.Это скорее предложение выйти за пределы Махута.В настоящее время он не получает такой тяги, как если бы он был более удобным для пользователя.

В сущности, пользовательский интерфейс Mahout немного изменчив и не дает четкого представления о том, как разрабатывать и обновлять интеллектуальные системы и их жизненные циклы, IMO.Mahout на самом деле неприемлем для академиков, они с большей вероятностью используют Matlab или R. В документах Mahout реализация случайного леса едва работает, и в документах есть ошибочные примеры и т. Д.подпрограммы Mahout зависят от алгоритма.В настоящее время я не вижу, чтобы Mahout никуда не уходил, опять же, IMO.Надеюсь я ошибаюсь!

http://shop.oreilly.com/product/0636920028536.do

...