Спасибо, что ответили на мой вопрос о том, когда у вас есть доступ к данным. Полученная вами ошибка возникла, когда вы позвонили cholesky. cholesky требует, чтобы ваша матрица была положительной полуопределенной. Один из способов проверить, является ли матрица полуположительно определенной, состоит в том, чтобы увидеть, все ли ее собственные значения больше нуля. Одно из собственных значений вашей матрицы корреляции / ковариации почти равно нулю. Я думаю, что Холески просто суетливый. Использование может использовать scipy.linalg.sqrtm
в качестве альтернативного разложения.
Для вашего вопроса о генерации многомерных нормалей генерируемая вами случайная нормаль должна быть стандартной случайной нормалью, т. Е. Средним значением 0 и шириной 1. Numpy предоставляет стандартному генератору случайных норм с np.random.randn
.
Чтобы сгенерировать многомерную нормаль, вы также должны взять декомпозицию ковариации, а не матрицу корреляции. Следующее сгенерирует многомерную нормаль с использованием аффинного преобразования, как в вашем вопросе.
from scipy.linalg import cholesky, sqrtm
relavant_columns = ['Affecting homelife',
'Affecting mobility',
'Affecting social life/hobbies',
'Affecting work',
'Mood',
'Pain Score',
'Range of motion in Doc']
# df is a pandas dataframe containing the data frame from figure 1
mu = df[relavant_columns].mean().values
cov = df[relavant_columns].cov().values
number_of_sample = 10
# generate using affine transformation
#c2 = cholesky(cov).T
c2 = sqrtm(cov).T
s = np.matmul(c2, np.random.randn(c2.shape[0], number_of_sample)) + mu.reshape(-1, 1)
# transpose so each row is a sample
s = s.T
Numpy также имеет встроенную функцию, которая может генерировать многомерные нормали напрямую
s = np.random.multivariate_normal(mu, cov, size=number_of_sample)