Существуют две средние величины, которые делают понятия как-то неясными, но они довольно просты - по крайней мере, в контексте recsys - позвольте мне уточнить их:
P @ K
Сколько релевантных элементов присутствует в рекомендациях top-k вашей системы
Например, чтобы вычислить P @ 3: , возьмите 3 верхние рекомендации для данного пользователя и проверьте, сколько из них являются хорошими.Это число, деленное на 3, дает вам P @ 3
AP @ K
Среднее значение P @ i для i =1, ..., K .
Например, для расчета AP @ 3: сумма P @ 1, P @ 2 и P @ 3 и деление этого значения на 3
AP @ K обычно рассчитывается для одногопользователь.
MAP @ K
Среднее значение AP @ K для всех пользователей.
Например, чтобы вычислить MAP @ 3: сумма AP @ 3 для всех пользователей и разделить это значение на количество пользователей
Если вы программист, вы можете проверить этот код , который является реализацией функций apk
и mapk
из ml_metrics
, библиотеки, поддерживаемой техническим директором Kaggle.
Надеюсь, это помогло!