У меня есть фрейм данных под названием «train» со столбцом «string», столбцом «длина строки» и столбцом «rank», который имеет ранжирование в диапазоне от 0 до 4.
Я хочу создать гистограмму длины строки для каждого ранжирования и построить для сравнения все гистограммы на одном графике.У меня возникают две проблемы с этим:
Единственный способ, которым я могу это сделать, - это создать отдельные наборы данных, например, со следующим типом кода:
S0 = train.loc[train['rank'] == 0]
S1 = train.loc[train['rank'] == 1]
Затем я создаю отдельные гистограммыдля каждого набора данных, используя:
plt.hist(train['string length'], bins = 100)
plt.show()
Этот код не отображает плотность, а вместо этого рассчитывает количество.Как я могу изменить свой код так, чтобы он отображал плотность?
Есть ли способ сделать это без необходимости создания отдельных наборов данных?Мне сказали, что мой метод «не пифонический»