У меня есть вариант использования для создания более значимой гистограммы, чем гистограммы по умолчанию.
У меня есть elasticsearch в качестве хранилища данных, где хранятся все мои числовые данные. поле цен с очень разными значениями. большая часть цен в диапазоне от 100 до 999 сосредоточена в районе 399-500, от 501 до 999 немного, затем снова от 999 до 1299 огромный диапазон и т. д.
пример:
399-500: 1542
501-999: 7501
1000-1299: 10214
1299-2000: 154
...
При создании гистограммы с размером сегмента 200 только 2 из 8 имеют 75% высоты полосы, другие очень малы.
Если я выбрал небольшой размер сегмента, тогда диаграмма станет тяжелой для рендеринга с 1000 + ведра.
Если я выбрал большой размер ковша, то выводы из построенной диаграммы бесполезны.
Я хочу сделать интеллектуальное сегментирование, в котором я могу разделить большие сегменты на небольшие диапазоны say of 50-70
и заодно объединить маленькие ведра в одно большое say of 1000
. чтобы диаграммы были более значимыми.
Существует ли код python для такого варианта использования.
Отредактировано:
Из-за двух всплесков я не могу визуализировать плоские области, чтобы показать фактические вариации, и я не могу показать распределение мощности в пиках, чтобы сказать, что диапазон цен, скажем, от 449 до 499 является наиболее значимым в пике от 399 до 500