Как расширить данные с моделируемыми данными в R? - PullRequest
0 голосов
/ 25 февраля 2019

У меня есть набор данных из 2 столбцов и 1000 строк, который я хотел бы смоделировать, чтобы он был 10000 строк.Я пытался использовать mvrnorm, но я получаю сообщение об ошибке несовместимых аргументов

Мой набор данных выглядит примерно так:

FORMAT                    SUB
GT:AD:DP:GQ:PL          0/1:30,10:40:99:189,0,833
GT:AD:DP:GQ:PL          0/0:2,0:2:6:0,6,38
GT:AD:DP:GQ:PL          0/0:1,0:1:3:0,3,34
GT:AD:DP:GQ:PGT:PID:PL  0/1:2,5:7:28:116,0,28
GT:AD:DP:GQ:PGT:PID:PL  0/1:1,2:3:29:40,0,29
GT:AD:DP:GQ:PL          0/0:1,0:1:3:0,3,36

Чтобы получить вывод, расширяющий это с имитацией данных, которые я пыталсяиспользуйте:

data <- read.csv('rsim.csv')
sigma <- matrix(data, ncol=2)
mvrnorm(10000, rep(0, nrow(sigma)), sigma, empirical = FALSE)

Я также пробовал:

rnorm(sigma)
1.0284460  0.7136265 -2.8664876

Но это не мой ожидаемый результат.Мой ожидаемый вывод - просто увеличить количество строк с похожими данными в обычном распределении

Я также получаю ошибки при попытке:

rnorm(10000, sigma)
Error in rnorm(10000, sigma) : invalid arguments

Требуемый вывод просторасширить, но не дублировать строки в моей таблице до большего числа, сохраняя их в нормальном распределении.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...