это Себастьян из Mahout.
Доступен набор данных с чешского сайта знакомств, который может вас заинтересовать: http://www.occamslab.com/petricek/data/
Кстати, термин «на основе предмета» относится кособый подход к совместной фильтрации, а не к самому набору данных, который обычно находится в общей форме триплексов оценки пользовательских элементов, с которыми работает большинство подходов к совместной фильтрации.
Мы хотели бы услышать ваши результаты экспериментов и опыт(если вы хотите поделиться ими) в нашем списке рассылки user@mahout.apache.org