Я бы хотел взвесить все мои значения PearsonItemShoity между двумя предметами в соответствии с количеством ярусов, которые они делят, на 50.
Или, другими словами, обновить общее сходство Пирсона между двумя предметами (например, пунктами a и b) -
Similarity_new_ab = Similarity_ab * numCoRatings_ab / 50
Как получить количество ячеек между двумя играми, используя существующую структуру mahout.
Может кто-нибудь связать меня (или проиллюстрировать) пример реализации спасателя?
Мои аргументы для этого следующие:
Я постулирую, что большинство вычисленных сходств Пирсона основано на небольшом количестве (1 или 2 в большинстве случаев) ячеек. Это привело бы к тому, что игры делят корреляцию Пирсона, равную 1, друг с другом, что на самом деле, вероятно, не имело бы место, если бы существовало больше вариантов.
Чтобы учесть это, я бы хотел изменить эти "наивные" сходства Пирсона на сходство, которое также основано на количестве совместных рейтингов.
Я думал, что это то, для чего был создан спасатель, но, думаю, я ошибся.