Я имею в виду предложения продуктов на Amazon или, в частности, рекомендации аналогичных групп на Last.fm.
Учитывая, что вы можете хранить полное поведение слушателей / покупателей в своих покупках (кто слушал, ЧТО как ЧАСТО?), Как вы рассчитываете, какие полосы похожи на какие-либо и сколько?
Я нашел несколько сайтов в Википедии ( Обучение правилам ассоциации , Анализ сродства ), но я хотел бы получить некоторую информацию с точки зрения программиста и, предпочтительно, некоторый псевдокодили код Python для него.
Учитывая, что у меня есть
dic = {
"Alice" : { "AC/DC" : 2, "The Raconteurs" : 3, "Mogwai" : 1 },
"Bob" : { "The XX" : 4, "Lady Gaga" : 3, "Mogwai" : 1, "The Raconteurs" : 1 }
"Charlie" : { "AC/DC" : 7, "Lady Gaga" : 7 }
}
, где числа являются подсчетами воспроизведения, как бы я повторил это, чтобы найти сходство полос?