Преобразование переменной (со многими точками данных, близкими к максимальному и минимальному) в равномерное распределение? - PullRequest
0 голосов
/ 28 апреля 2020

Мне нужно сделать несколько моделей в R и иметь некоторые проблемы с некоторыми из моих предикторов. Они распределены между 0 и 1, они дают процент типов почвопокровных. Например, 0,3 означает, что 30% площади покрыто лесом.

Вот гистограмма и график плотности одного из них:

гистограмма график плотности

Я хочу преобразовать эти предикторы в равномерное распределение в R (оно не должно быть идеальным). Я не знаю, какое преобразование использовать, поскольку существует множество точек данных, близких к максимальному и минимальному из них.

Любая помощь приветствуется, спасибо!

1 Ответ

1 голос
/ 28 апреля 2020

Мне не понятно, зачем вам это нужно - большинство статистических методов не предъявляют требований к распределению переменных предиктора - но

rank(x)/(length(x)+1)

даст вам новую переменную, которая распределена равномерно от 0 до 1 (и никогда не бывает точно 0 или 1)

...