Как я могу построить оценку максимального правдоподобия в Python - PullRequest
5 голосов
/ 26 октября 2011

Я рисую некоторые образцы из экспоненциального распределения . В моем первом эксперименте я рисую 1000 образцов, а во втором - 10 000 образцов из этого распределения. (с numpy.random.exponential)

Я хотел бы визуально сравнить разницу оценки максимального правдоподобия двух моих экспериментов. (поскольку это экспоненциальное распределение, MLE будет просто средним значением выборки, поэтому в моем втором эксперименте MLE должен быть ближе к истинной плотности).

Как я могу сделать такое сравнение в Python? Я знаю, как строить графику в matplotlib, но здесь я не знаю, какой тип графики мне следует использовать.

1 Ответ

4 голосов
/ 27 октября 2011

Учитывая замечания в комментариях, я думаю, что-то вроде того, что вы ищете:

import numpy as np
import matplotlib.pyplot as plt

def plot_exponential_density(mu, xmax, fmt, label):
        x = np.arange(0, xmax, 0.1)
        y = 1/mu * np.exp(-x/mu)
        plt.plot(x, y, fmt, label=label)

def sample_and_plot(N, color):
        # first sample N valus
        samples = np.zeros( (N,1) )
        for i in range(0,N):
                samples[i] = np.random.exponential()

        # determine the mean
        mu = np.mean(samples)
        print("N = %d  ==> mu = %f" % (N, mu))

        # plot a histogram of the samples
        (n, bins) = np.histogram(samples, bins=int(np.sqrt(N)), density=True)
        plt.step(bins[:-1], n, color=color, label="samples N = %d" % N)

        xmax = max(bins)

        # plot the density according to the estimated mean
        plot_exponential_density(mu, xmax, color + "--", label="estimated density N = %d" % N)

        return xmax


# sample 100 values, draw a histogram, and the density according to
# the estimated mean
xmax1 = sample_and_plot(100, 'r')
# do the same for 1000 samples
xmax2 = sample_and_plot(10000, 'b')

# finally plot the true density
plot_exponential_density(1, max(xmax1, xmax2), 'k', "true density")

# add a legend
plt.legend()

# and show the plot
plt.show()

enter image description here

Я использовал 100 и 10000 образцов, так какс 1000 образцов оценка уже довольно хорошая.Но все же, имея всего 100 образцов, я несколько удивляюсь, насколько хороша оценка среднего значения и, следовательно, плотности.Учитывая только гистограмму без знания того, что выборки взяты из экспоненциального распределения, я не уверен, что признал бы здесь экспоненциальное распределение ...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...