PyMC3, сэмплер NUTS, что здесь происходит? - PullRequest
2 голосов
/ 30 сентября 2019

Может кто-нибудь указать мне документы, которые объяснят, что я вижу?

Розовые вещи в блокноте Jupyter заставляют меня думать, что что-то не так.

Использование PyMC3 (кстати, этоупражнение для класса, и я понятия не имею, что я делаю).

Я подключил числа, изначально получил ошибку около 0 с по диагонали, поменял местами alpha_est и rate_est на 1/alpha_est и 1/rate_est (и перестал получать ошибку), но я все ещеполучите розовый материал.

Этот код поставляется с упражнением:

# An initial guess for the gamma distribution's alpha and beta
# parameters can be made as described here: 
# https://wiki.analytica.com/index.php?title=Gamma_distribution

alpha_est = np.mean(no_insurance)**2 / np.var(no_insurance)
beta_est = np.var(no_insurance) / np.mean(no_insurance)

# PyMC3 Gamma seems to use rate = 1/beta
rate_est = 1/beta_est
# Initial parameter estimates we'll use below
alpha_est, rate_est

А затем код, который я должен добавить:

enter image description here

Должен ли розовый материал вызывать у меня нервозность или я просто говорю "Нет ошибок, идите дальше"?

=======

The "ноль проблем "

---------------------------------------------------------------------------
RemoteTraceback                           Traceback (most recent call last)
RemoteTraceback: 
"""
Traceback (most recent call last):
  File "/Local/Users/vlb/anaconda3/lib/python3.7/site-packages/pymc3/parallel_sampling.py", line 110, in run
    self._start_loop()
  File "/Local/Users/vlb/anaconda3/lib/python3.7/site-packages/pymc3/parallel_sampling.py", line 160, in _start_loop
    point, stats = self._compute_point()
  File "/Local/Users/vlb/anaconda3/lib/python3.7/site-packages/pymc3/parallel_sampling.py", line 191, in _compute_point
    point, stats = self._step_method.step(self._point)
  File "/Local/Users/vlb/anaconda3/lib/python3.7/site-packages/pymc3/step_methods/arraystep.py", line 247, in step
    apoint, stats = self.astep(array)
  File "/Local/Users/vlb/anaconda3/lib/python3.7/site-packages/pymc3/step_methods/hmc/base_hmc.py", line 130, in astep
    self.potential.raise_ok(self._logp_dlogp_func._ordering.vmap)
  File "/Local/Users/vlb/anaconda3/lib/python3.7/site-packages/pymc3/step_methods/hmc/quadpotential.py", line 231, in raise_ok
    raise ValueError('\n'.join(errmsg))
ValueError: Mass matrix contains zeros on the diagonal. 
The derivative of RV `alpha__log__`.ravel()[0] is zero.
"""

The above exception was the direct cause of the following exception:

ValueError                                Traceback (most recent call last)
ValueError: Mass matrix contains zeros on the diagonal. 
The derivative of RV `alpha__log__`.ravel()[0] is zero.

The above exception was the direct cause of the following exception:

RuntimeError                              Traceback (most recent call last)
<ipython-input-14-36f8e5cebbe5> in <module>
     13     g = pm.Gamma('g', alpha=alpha_, beta=rate_, observed=no_insurance)
     14 
---> 15     trace = pm.sample(10000)

/Local/Users/vlb/anaconda3/lib/python3.7/site-packages/pymc3/sampling.py in sample(draws, step, init, n_init, start, trace, chain_idx, chains, cores, tune, progressbar, model, random_seed, discard_tuned_samples, compute_convergence_checks, **kwargs)
    435             _print_step_hierarchy(step)
    436             try:
--> 437                 trace = _mp_sample(**sample_args)
    438             except pickle.PickleError:
    439                 _log.warning("Could not pickle model, sampling singlethreaded.")

/Local/Users/vlb/anaconda3/lib/python3.7/site-packages/pymc3/sampling.py in _mp_sample(draws, tune, step, chains, cores, chain, random_seed, start, progressbar, trace, model, **kwargs)
    967         try:
    968             with sampler:
--> 969                 for draw in sampler:
    970                     trace = traces[draw.chain - chain]
    971                     if (trace.supports_sampler_stats

/Local/Users/vlb/anaconda3/lib/python3.7/site-packages/pymc3/parallel_sampling.py in __iter__(self)
    391 
    392         while self._active:
--> 393             draw = ProcessAdapter.recv_draw(self._active)
    394             proc, is_last, draw, tuning, stats, warns = draw
    395             if self._progress is not None:

/Local/Users/vlb/anaconda3/lib/python3.7/site-packages/pymc3/parallel_sampling.py in recv_draw(processes, timeout)
    295             else:
    296                 error = RuntimeError("Chain %s failed." % proc.chain)
--> 297             raise error from old_error
    298         elif msg[0] == "writing_done":
    299             proc._readable = True

RuntimeError: Chain 0 failed.

- это" подсказка "в инструкциях, в которых говорится, что я должен использовать 1/rate_est?

Теперь вы собираетесьсоздайте свою собственную модель PyMC3!

Используйте экспоненциальный априор для альфы. Назовите эту стохастическую переменную alpha_.
Аналогично, используйте экспоненциальный априор для параметра скорости (1 / ?) в гамме PyMC3.
Назовите эту стохастическую переменную rate_ (но она будет предоставлена ​​как бета-параметр pm.Gamma). Подсказка: чтобы установить априор с экспоненциальным распределением для ?, где у вас есть начальная оценка для ? из ?0, используйте масштабный параметр 1 / ?0.
Создайте свое гамма-распределение с вашими стохастическими переменными alpha_ и rate_ и наблюдаемымиdata.
Выполните 10000 отрисовок.


Проблема с нулем может быть из-за того, что вы выбираете нули из экспоненциального распределения.

Ah:

rate_est равно 0.00021265346963636103

rate_ci = np.percentile (trace ['rate_'], [2.5, 97.5]) rate_ci = [0.00022031, 0.00028109]

1 / rate_est is4702.486170152818

Я могу поверить, что выбираю нули, если использую rate_est.

1 Ответ

1 голос
/ 30 сентября 2019

У меня есть сомнения по поводу вашего шага 1 / альфа. Смотрите это обсуждение: https://discourse.pymc.io/t/help-with-fitting-gamma-distribution/2630

Нулевая проблема может быть из-за того, что вы выбираете нули из экспоненциального распределения.

Вы можете посмотреть здесь: https://docs.pymc.io/notebooks/PyMC3_tips_and_heuristic.html cell [6]

Я думаю, что вы в порядке с выходом сэмплера. Вы можете проверить свои дистрибутивы, используя traceplot.

...