У вас есть опечатка в гауссовской функции, которая не совпадает с упомянутой выборкой.Но это не обязательно говорить как «неправильный», поскольку он просто влияет на значение стандартного отклонения.
Вместо np.exp(-np.power((x-dk)/sigma,2.) / 2.)
, оно должно быть
np.exp(-np.power((x-dk),2.) /( sigma / 2.))
Редактировать : И сигма должна быть 10 ^ -3, чтобы воспроизвести предоставленный образец.Но сейчас я просто использую 10 ^ -2, так как небольшое отклонение делает вещи слишком чувствительными.
Сигма будет настолько мала, что функция Гаусса будет настолько чувствительна к размеру выборки.
Но исправление этого не даст вам желаемого результата, вы заметите, что ниже 1000,средняя полоса еще немного ниже.
Почему?
Во-первых, вы должны заметить:
Функция Гаусса не предназначена для генерации пошаговой функции в основном назначении.
Давайте рассмотрим более подробный пример о выборке, она немного связана со статистикой.
N = 100
for i in range(50):
y += 6*gaussian(x, i, np.power(10.,-3.))
Что происходит с этим графиком?Почему в середине есть падение?
Причина в том, что функция Гаусса является приближением вероятности.Допустим, что человек был уничтожен новым гриппом.Только 100 человек выживают, хорошо, теперь мы выбираем 50 человек и проверяем, сколько людей заражено (1 из них заражен).
Итак, какова вероятность выбора 50 человек из 50 и как мы можем позвонить, чтобы сказать, что в одной группе кто-то склонился?
Ответ:1, наверняка вы выбрали все 50, некоторые из них должны быть отклонены
Так какова вероятность выбора 25 человек из 50 и как мы можем позвонить, сказать, что есть одна группа?кто-то задумался?
Ответ: 1 / nCr (50,25) ~ = 0
Кстати, на этот раз гауссовская функция не очень хорошаяприближение как для низкого размера выборки.(Из-за центральной теоремы о пределе, wiki )
N = 10000
Я уменьшил некоторую точку выборки, чтобы сэкономить время, поэтому
for i in range(0, 10000, 100):
y += 6*gaussian(x, i, np.power(10.,-3.))
Это то же самое, что для выбора нескольких тысяч из нескольких десятков тысяч все еще трудно определить разницу.
Для 100 выборокразница в вероятности выбора еще одного человека для подсчета огромна.
49 из 50, и 48 из 50 имеют большое значение, так как в целом в пуле всего 100 человек.
Нодля 10000, 49 из 50 и 48 из 50, кого это волнует?Они почти такие же из этого огромного пула.Вот почему вы можете сделать три столбца одинаковой высоты .
PS. Я упоминаю в основном идею центральной предельной теоремы: почему при большом пуле размер выборки не будет большимразница в том, чтобы говорить правду, и поэтому мы можем сделать «выборку», чтобы представить весь пул.