Apache Mahout, использовать или не использовать - PullRequest
1 голос
/ 18 января 2012

Я внедряю простую систему рекомендаций для коллекции пользовательских компонентов.

Я планировал сделать это с JPA и несколькими выделенными EJB.У моих сущностей будет дополнительная пара списков, содержащих самые последние рекомендации, затем EJB будет сканировать набор данных и периодически обновлять этот список.Модель основана на отношениях между компонентами и не зависит от поведения пользователя в прошлом.Я ожидаю, что набор данных останется относительно небольшим.вероятно, не более полумиллиона предметов.

У меня есть довольно хорошее представление о том, как сделать это с JPA и EJB, и я думаю, что для моего конкретного случая использования это будет очень эффективно.

Должен ли я потратить время на изучение и внедрение Mahout?У меня есть небольшой опыт работы с hadoop, хотя я не думаю, что мой набор данных будет достаточно большим, чтобы оправдать использование слона.

Кроме того, кто-нибудь может подсказать мне хороший учебник по реализациирекомендательные системы с mahout?

Большое спасибо.

1 Ответ

3 голосов
/ 18 января 2012

Если вы реализуете механизм рекомендаций, имейте в виду, что этот фрагмент Mahout имеет совершенно разные реализации, основанные на Hadoop, а не на Hadoop.Это хорошо, потому что Hadoop - это не та вещь, которая была бы подключена напрямую к чему-либо на основе EJB.И у вас нет огромных масштабных проблем.Так что вам не нужно беспокоиться о Hadoop.

Вы хотите посмотреть на вещи в org.apache.mahout.cf.taste.impl помимо пакета .hadoop;это всего лишь чистая Java, чтобы вы могли встроить ее в EJB.Я думаю, что вы хотите взглянуть на Recommender API, а затем просто обернуть его в свой сессионный компонент и выставить его так, как вам нравится.

(Вы действительно хотите использовать EJB в эти дни? Отдельный вопрос ...)

Фактически, в предыдущем выпуске 0.4 еще был пример привязки EJB в качестве сессионного компонента без сохранения состояния.Вы можете найти и использовать эту обертку.

Лучший веб-ресурс для этой части кода: https://cwiki.apache.org/MAHOUT/recommender-documentation.html

Наша книга, Mahout в действии , - этоочевидно, не бесплатно, но, безусловно, лучшая и единственная ссылка для проекта.Я написал соответствующий код здесь и часть книги об этом коде, и поэтому он довольно прямой из источника.

...