Наборы данных для Apache Mahout - PullRequest
4 голосов
/ 16 августа 2010

Я ищу наборы данных, которые можно использовать для реализации рекомендательного системного сценария Apache Mahout.Я знаю только наборы данных MovieLens из GroupLens Research group.

Кто-нибудь знает какие-либо другие наборы данных, которые можно использовать для внедрения системы рекомендаций?Мне особенно интересны наборы данных на основе элементов, хотя другие наборы данных приветствуются.

Ответы [ 3 ]

4 голосов
/ 18 августа 2010

это Себастьян из Mahout.

Доступен набор данных с чешского сайта знакомств, который может вас заинтересовать: http://www.occamslab.com/petricek/data/

Кстати, термин «на основе предмета» относится кособый подход к совместной фильтрации, а не к самому набору данных, который обычно находится в общей форме триплексов оценки пользовательских элементов, с которыми работает большинство подходов к совместной фильтрации.

Мы хотели бы услышать ваши результаты экспериментов и опыт(если вы хотите поделиться ими) в нашем списке рассылки user@mahout.apache.org

3 голосов
/ 24 августа 2010

При поиске наборов данных я обнаружил несколько сайтов, где перечислены общедоступные наборы данных, которые можно использовать для интеллектуального анализа данных. Некоторые из них можно использовать и для Mahout.

Bixo Labs

Наборы данных UCI

KDnuggets

0 голосов
/ 03 сентября 2014

Вы можете взглянуть на iPinYou RTB Bidding Data Quora: http://qr.ae/OrqgM http://contest.ipinyou.com/data-release.html

...