Я бы предложил решить эту проблему, используя Байесовский логический вывод .
Байесовский классификатор
Поскольку проблема в настоящее время указана, единственная классификациядоступный контент - это распределение пользователей, которые его посетили, и характеристики этих пользователей.Совместное распределение вероятностей по всем пользовательским измерениям для всех пользователей является классификатором этого контента.
Так как же использовать вышеуказанную информацию?При заданном контенте A с распределением доступа пользователя B для всех пользователей и профилем C целевого пользовательского признака можно вычислить вероятность того, что последний пользователь будет заинтересован в контенте A. Если выполнить это вычисление для всего контента относительно профиля C пользователя, одинполучает список значений вероятности интереса для всего контента.Сортируйте этот список по значениям вероятности, чтобы определить наилучший возможный контент для целевого пользователя.
Во многих случаях только подмножество параметров характеристик пользователя может быть предиктором значения данного элемента контента для пользователей.Это обычная ситуация для байесовских классификаторов в целом и привела к разработке байесовских сетей , которые представляют собой структурированные графики ключевых переменных и их условных зависимостей.Такие сети также могут быть смоделированы с помощью байесовских методов вывода.
Байесовское сетевое программное обеспечение
Программное обеспечение WEKA Data Mining является Java с открытым исходным кодом.библиотека, которая реализует многие распространенные методы классификации, в том числе байесовские сетевые классификаторы, и ее стоит попробовать.Я не могу рекомендовать какие-либо конкретные эквивалентные C # пакеты, но быстрый веб-поиск выявил по крайней мере один коммерческий байесовский пакет для .NET, Bayes Server .
Рекомендуемое чтение
Существует довольно большой объем литературы, посвященной байесовским классификаторам, и это очень надежный метод, который используется для фильтрации спама, обнаружения наркотиков и т. Д. Ниже приведены две книги, которые я могу порекомендовать для этого.Книга Болстада для начинающих, а книга Перла более продвинутая.
Болстад, Уильям М. (2007). Введение в байесовскую статистику , второе издание, Джон Уайли.
Иудея Перл (2000). Причинность: модели, рассуждения и умозаключения , издательство Кембриджского университета.