Масс-Пойнт, дельта Дирака в процессах Дирихле - PullRequest
0 голосов
/ 25 октября 2010

При работе с процессами Дирихле, согласно [Teh, 2007], DP определяется как базовая вероятность H и масштабный коэффициент «альфа»

Согласно Построению Разрушения Палки, случайное вытягивание G из DP:

G ^ DP (альфа, Н)

выдаются:

G = сумма (pi_k * delta_theta_k) по k от 1 до бесконечности

pi_k - это упорядоченные розыгрыши из бета-дистрибутива с учетом длины унитарной палки

delta_theta_k - точечная масса с центром в "theta_k" (theta_k - случайные вытяжки из базового распределения)

У меня есть достаточно четкое понимание всех переменных, но я не знаю, что они подразумевают под "точкой массы": это плотность вероятности этого розыгрыша или что-то еще.

Было бы замечательно, если бы вы могли указать мне в любом направлении, только ссылка была бы удивительной.

Спасибо

1 Ответ

1 голос
/ 26 октября 2010

G - распределение вероятностей по распределениям вероятностей. Эти (суб) вероятностные распределения находятся в некоторой области, назовем это BigTheta.

Каждый theta_k взят из дистрибутива BigTheta, поэтому он является элементом BigTheta.

Каждый delta_theta_k - это распределение вероятностей по BigTheta, определенное как delta_theta_k (theta_k) = 1 и delta_theta_k (все остальное) = 0. Это то, что они называют распределением «точечной массы», потому что вся масса распределения через одну точку домена.

G - это распределение вероятностей по распределению вероятностей по BigTheta, определенное как: для некоторого распределения по BigTheta, называемого f (которое параметризовано посредством theta), G (f (theta)) = sum (pi_k * delta_theta_k (theta)).

Надеюсь, это поможет, я думаю, у вас, как правило, правильная идея, что просто обозначения могут быть немного сложными (и SO не лучший для такого рода обозначений). Обычно, когда вы сталкиваетесь с символом, полезно подумать о том, что это за функция, то есть над чем она определена.

...