Размер гистограммы - PullRequest
       11

Размер гистограммы

0 голосов
/ 13 ноября 2018

У меня есть такой код, и мне интересно, почему мой размер бина двух построенных графиков отличается?

import matplotlib.pyplot as pyplot
bins=15
pyplot.rcParams["figure.figsize"] = (10,10)

#echte_Ladezeit
pyplot.hist(Y_test, bins, alpha=1, label='Y_test; orange Dateien', 
color='orange', weights = np.ones_like(Y_test)/float(len(Y_test)))
pyplot.hist(Y_train, bins, alpha=1, label='Y_train; grüne Dateien', 
color='green', weights = np.ones_like(Y_train)/float(len(Y_train)))
pyplot.title('Verteilung echte_Ladezeit')
pyplot.xlabel('echte_Ladezeit')
pyplot.ylabel('Häufigkeit [%]')
pyplot.legend(loc='upper right')
pyplot.show()

на самом деле отмеченная ширина оранжевого и зеленого должна быть одинаковой, верно? У меня есть ошибка в моем коде? enter image description here

1 Ответ

0 голосов
/ 13 ноября 2018

Ваш код содержит pyplot.hist(..., bins, ...), где bins = 15. Это означает, что 15 корзин расположены на одинаковом расстоянии между максимальными и минимальными значениями. Максимальные и минимальные значения различаются для двух наборов данных, поэтому вы получаете разные наборы по 15 бинов. Если вы хотите получить ячейки одинаковой ширины для каждого набора данных, у вас есть как минимум два варианта.

  1. Нормализация наборов данных - максимальные и минимальные значения должны быть одинаковыми для обоих наборов данных.

  2. Определите ячейки как последовательность (например, list(range(0, 40000 + 1, 5000))), как описано здесь .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...