как выполнить числовую выборку из совместной, дискретной функции распределения вероятностей - PullRequest
7 голосов
/ 27 мая 2011

У меня есть 2D «тепловая карта» или PDF, который мне нужно воссоздать путем случайной выборки. И.Е. У меня есть 2D карта плотности вероятности, показывающая начальные местоположения. Мне нужно случайным образом выбрать стартовые места с той же вероятностью, что и в оригинальном PDF.

Чтобы сделать это, я думаю, мне нужно сначала найти объединенный CDF (функция кумулятивной плотности), а затем выбрать случайные однородные числа для выборки CDF. Вот где я застреваю.

Как мне найти совместный CDF моего PDF? Я попытался сделать кумулятивную сумму по обоим измерениям, но это не дало правильного результата. Мои знания статистики меня не подводят.

РЕДАКТИРОВАТЬ Тепловая карта / PDF является формой [x, y, z], где Z - интенсивность или вероятность в каждой точке x, y.

Ответы [ 4 ]

3 голосов
/ 27 мая 2011

Сначала вы можете просмотреть 2D-карту плотности, и для каждой (x, y) пары в ней найти z по поиску в PDF.Это даст вам отправную точку (x, y) с вероятностью z.Таким образом, каждая из отправных точек имеет свою собственную вероятность из PDF.Теперь вы можете упорядочить начальные точки, случайным образом выбрать число и сопоставить его с какой-либо начальной точкой.

Например, предположим, что у вас есть n начальных точек: P1 .. Pn.С вероятностью p1 .. pn (нормированные или взвешенные вероятности, поэтому сумма равна 100%).Допустим, вы выбрали случайное значение p, выберите P1, если p

1 голос
/ 17 апреля 2012

Это то, что я тоже хочу сделать !!

У меня есть объединенная функция плотности для независимых переменных X и Y. И теперь я хочу выбрать новые x, y из этого распределения.

То, что я должен сделать, - это найти совместное кумулятивное распределение, а затем каким-то образом сделать выборку из него. Это именно то, что вы, казалось, сделали.

Не могли бы вы быть более конкретным, когда говорите, что используете "однородные случайные числа для поиска соответствующих значений индекса"?

Только для справки: X - размер ордеров на покупку, а Y - размер заявок на покупку на фондовом рынке.

1 голос
/ 27 мая 2011

Что ж, как отмечено в этом ответе , для моего случая не обязательно имеет значение, что мое распределение является двумерным.Так как я могу все нормализовать так, чтобы это был настоящий pdf (общая поверхность объединяется в 1), я могу затем переставить матрицу MxN в вектор 1xM * N.Получив это, я могу сделать кумулятивный интеграл (cumtrapz в MATLAB), а затем сделать выборку из этого (использовать равномерное случайное число, чтобы найти соответствующее значение индекса).

1 голос
/ 27 мая 2011

Выборка Гиббса должна дать вам то, что вы хотите

http://en.wikipedia.org/wiki/Gibbs_sampling

...