У меня есть несколько наборов данных с очень неравномерно распределенными значениями: большинство значений очень низкие, но некоторые очень высокие, например, на скриншоте гистограммы или даже более экстремальные.
Меня действительно интересует различия в высоких значениях.
Итак, я ищу метод классификации, который устанавливает много значений разрыва там, где мало значений данных, и большие классы, где есть много значений. Может быть, что-то вроде обратной квантильной классификации.
У вас есть предложение, какой алгоритм может помочь в решении этой задачи, предпочтительно в Python?
![enter image description here](https://i.stack.imgur.com/fEBQj.png)