Проблема корреляции Пирсона - PullRequest
0 голосов
/ 07 мая 2011

Я не уверен, какие цифры использовать ниже в задаче, которую я пытаюсь решить, которая использует формулу корреляции Пирсона.

    A  B  C  D  E  F
Bob 4  5     4  2
Fra 2  2     2  3  2
Lee 2  4  3        5
Cha 5  4     4  1

«Опишите подход, основанный на окрестности, с использованием корреляции Пирсона и взвешенных средних для генерации прогноза, будет ли Бобу нравиться« F ». В вашем ответе должны быть изложены основные этапы подхода, основанного на соседстве, и показаны шаги, необходимые для генерации прогноза»

Итак, я хочу выяснить, понравится ли Бобу F ... (5 = Нравится 1 = Не нравится) Я понимаю формулу Пирсона, но я не уверен, с каким другим «пользователем» сравнить Боба, или я должен учитывать мнения всех пользователей.

Я также понимаю, как не рекомендуется отвечать на вопросы, похожие на домашние задания, но я часами рыскал в Интернете, пытаясь выяснить это.

Любая помощь будет признательна, спасибо заранее.

1 Ответ

0 голосов
/ 07 мая 2011

Вероятно, необходимо увидеть специфику вопроса, чтобы придумать лучший ответ для самого вопроса, но один из подходов, который может показаться жизнеспособным, состоит в том, чтобы вычислить корреляцию между Бобом и каждым другим человеком (Fra, Lee и Cha) и взвесите их оценки для F по этим корреляциям.

В этом случае, поскольку у вас есть только оценки F для Фра и Ли, просто возьмите (corr_(Bob, Fra) * 2 + corr_(Bob, Lee))/2

...