Внутри категориальная ось x пронумерована 0,1,2,...
. Чтобы построить кривую в тех же положениях, используйте range(len(lst))
для значений x. Поскольку закон Ципфа вычисляет его значения, начиная с 1, соответствующие значения y можно рассчитать как zipf.pmf(p, alpha)
, где p равно 1,2,3,...
, а alpha - это параметр zipf. Для выравнивания с ненормализованным гистограммой эти значения необходимо умножить на сумму. Этот пост можно использовать, чтобы найти наиболее подходящую альфу.
import matplotlib.pyplot as plt
from scipy.stats import zipf
lst = [(60462, 'Italy'), (46755, 'Spain'), (10423, 'Greece'), (10197, 'Portugal'), (8737, 'Serbia'), (4105, 'Croatia'),
(3281, 'Bosnia and\nHerzegovina'), (2878, 'Albania'), (2083, 'North\nMacedonia'), (2079, 'Slovenia'),
(628, 'Montenegro'), (442, 'Malta'), (77, 'Andorra'), (34, 'San Marino'), (34, 'Gibraltar'), (1, 'Holy See')]
plt.bar([key for val, key in lst], [val for val, key in lst], color='limegreen')
alpha = 1.37065874
total = sum([p for p, c in lst])
plt.plot(range(len(lst)), [zipf.pmf(p, alpha) * total for p in range(1, len(lst) + 1)], color='crimson', lw=3)
plt.ylabel("Population")
plt.xticks(rotation='vertical')
plt.tight_layout()
plt.show()
![resulting plot](https://i.stack.imgur.com/qfxqV.png)