начать с модели y = x + e
, где e
- ошибка (нормальная случайная величина). e
должно иметь среднее значение 0 и дисперсию k.
Короче говоря, вы можете написать формулу для ожидаемого значения Пирсона в терминах k и решить для k. обратите внимание, что вы не можете случайным образом генерировать данные с Пирсоном, точно равным конкретному значению, только с ожидаемым Пирсоном определенного значения.
Я постараюсь вернуться и отредактировать этот пост, чтобы включить решение для закрытой формы, когда у меня будет доступ к какой-то статье.
РЕДАКТИРОВАТЬ: хорошо, у меня есть волнистое решение, которое, вероятно, правильно (но для подтверждения потребуется тестирование). пока предположим, что желаемый Pearson = p > 0
(вы можете выяснить случай p < 0
). Как я уже упоминал ранее, установите для вашей модели значение Y = X + E
(X
однородно, E
нормально).
- образец, чтобы получить ваши х
- вычислить var (x)
- дисперсия E должна быть:
(1/(rsd(x)))^2 - var(x)
- генерирует ваши y на основе ваших x и выборки из вашей обычной случайной величины
E
для p < 0
, установите Y = -X + E
. действуйте соответственно.
В основном это следует из определения Пирсона: cov (x, y) / var (x) * var (y). когда вы добавляете шум к x (Y = X + E
), ожидаемая ковариационная cov (x, y) не должна изменяться по сравнению с отсутствием шума. var (x) не изменяется. var (y) является суммой var (x) и var (e), отсюда и мое решение.
ВТОРОЕ РЕДАКТИРОВАНИЕ: хорошо, мне нужно лучше прочитать определения. определение Пирсона: cov (x, y) / (sd (x) sd (y)). Исходя из этого, я думаю, что истинное значение var (E) должно быть (1 / (r sd (x))) ^ 2 - var (x). посмотрите, работает ли это.