Значения шкалы в диапазоне (0, 1) - PullRequest
0 голосов
/ 14 декабря 2018

Я хочу масштабировать свои значения в диапазоне (0, 1), но без получения значений 0 и 1, как при MinMax Scaler .Я думал, что, вероятно, добавив что-то к функции MinMax Scaler , например:

x_scaled [i] = (x [i] - min (x) + - что-то) / (max (x) - min (x) + - что-то)

, чтобы для минимальных значений получить что-то очень маленькое, но не 0, а для максимальных значений получить что-то очень близкое к 1, но не 1. Есть идеи?

1 Ответ

0 голосов
/ 14 декабря 2018

Вы можете использовать feature_range, как указано в комментариях.

Для something вы можете попытаться использовать что-то более умное, чем небольшое значение, например, процентиль (0,1 или 0,5 или 1 слева).сторона и 99 или 99,5 или 99,9 справа - зависит от ваших данных).

Или можно выполнить более простой подход, где ваши something будут равны min() и max()значения в масштабированном столбце.Например, вы можете масштабировать от 0.9 * min() до 1.1 * max()

PS Я полагаю, что действительно небольшое значение, например 1e-8, может быть округлено где-то в коде.

...