Свен показал, как использовать класс gaussian_kde
от Scipy, но вы заметите, что он не похож на то, что вы сгенерировали с помощью R. Это потому, что gaussian_kde
пытается автоматически определить пропускную способность. Вы можете поиграть с полосой пропускания, изменив функцию covariance_factor
класса gaussian_kde
. Во-первых, вот что вы получаете без изменения этой функции:
Однако, если я использую следующий код:
import matplotlib.pyplot as plt
import numpy as np
from scipy.stats import gaussian_kde
data = [1.5]*7 + [2.5]*2 + [3.5]*8 + [4.5]*3 + [5.5]*1 + [6.5]*8
density = gaussian_kde(data)
xs = np.linspace(0,8,200)
density.covariance_factor = lambda : .25
density._compute_covariance()
plt.plot(xs,density(xs))
plt.show()
Я получаю
что довольно близко к тому, что вы получаете от R. Что я сделал? gaussian_kde
использует изменяемую функцию, covariance_factor
для расчета пропускной способности. Перед изменением функции значение, возвращаемое covariance_factor для этих данных, составляло около .5. Понижение этого уменьшило пропускную способность. Мне пришлось позвонить _compute_covariance
после изменения этой функции, чтобы все факторы были рассчитаны правильно. Это не точное соответствие с параметром bw из R, но, надеюсь, оно поможет вам в правильном направлении.