У меня есть набор данных из 2 столбцов и 1000 строк, который я хотел бы смоделировать, чтобы он был 10000 строк.Я пытался использовать mvrnorm, но я получаю сообщение об ошибке несовместимых аргументов
Мой набор данных выглядит примерно так:
FORMAT SUB
GT:AD:DP:GQ:PL 0/1:30,10:40:99:189,0,833
GT:AD:DP:GQ:PL 0/0:2,0:2:6:0,6,38
GT:AD:DP:GQ:PL 0/0:1,0:1:3:0,3,34
GT:AD:DP:GQ:PGT:PID:PL 0/1:2,5:7:28:116,0,28
GT:AD:DP:GQ:PGT:PID:PL 0/1:1,2:3:29:40,0,29
GT:AD:DP:GQ:PL 0/0:1,0:1:3:0,3,36
Чтобы получить вывод, расширяющий это с имитацией данных, которые я пыталсяиспользуйте:
data <- read.csv('rsim.csv')
sigma <- matrix(data, ncol=2)
mvrnorm(10000, rep(0, nrow(sigma)), sigma, empirical = FALSE)
Я также пробовал:
rnorm(sigma)
1.0284460 0.7136265 -2.8664876
Но это не мой ожидаемый результат.Мой ожидаемый вывод - просто увеличить количество строк с похожими данными в обычном распределении
Я также получаю ошибки при попытке:
rnorm(10000, sigma)
Error in rnorm(10000, sigma) : invalid arguments
Требуемый вывод просторасширить, но не дублировать строки в моей таблице до большего числа, сохраняя их в нормальном распределении.