Mahout Rescorer реализация - PullRequest
       3

Mahout Rescorer реализация

1 голос
/ 20 августа 2011

Я бы хотел взвесить все мои значения PearsonItemShoity между двумя предметами в соответствии с количеством ярусов, которые они делят, на 50.

Или, другими словами, обновить общее сходство Пирсона между двумя предметами (например, пунктами a и b) - Similarity_new_ab = Similarity_ab * numCoRatings_ab / 50

  1. Как получить количество ячеек между двумя играми, используя существующую структуру mahout.

  2. Может кто-нибудь связать меня (или проиллюстрировать) пример реализации спасателя?

Мои аргументы для этого следующие:

Я постулирую, что большинство вычисленных сходств Пирсона основано на небольшом количестве (1 или 2 в большинстве случаев) ячеек. Это привело бы к тому, что игры делят корреляцию Пирсона, равную 1, друг с другом, что на самом деле, вероятно, не имело бы место, если бы существовало больше вариантов.

Чтобы учесть это, я бы хотел изменить эти "наивные" сходства Пирсона на сходство, которое также основано на количестве совместных рейтингов.

Я думал, что это то, для чего был создан спасатель, но, думаю, я ошибся.

1 Ответ

0 голосов
/ 20 августа 2011

Вы хотите метод getNumUsersWithPreferenceFor() на DataModel и передать ему два идентификатора элемента.Я не думаю, что это лучшее, что можно сделать для этого показателя сходства.Если вы используете совместное вхождение, вместо этого посмотрите LogLikelihoodSimilarity.

Это не имеет ничего общего с Rescorer, но какой у вас вопрос?

...