Как нормализовать массив NumPy с точностью до определенного диапазона? - PullRequest
103 голосов
/ 14 ноября 2009

После некоторой обработки массива аудио или изображений его необходимо нормализовать в пределах диапазона, прежде чем он сможет быть записан обратно в файл. Это можно сделать так:

# Normalize audio channels to between -1.0 and +1.0
audio[:,0] = audio[:,0]/abs(audio[:,0]).max()
audio[:,1] = audio[:,1]/abs(audio[:,1]).max()

# Normalize image to between 0 and 255
image = image/(image.max()/255.0)

Есть ли менее подробный, удобный способ сделать это? matplotlib.colors.Normalize() не похоже на связь.

Ответы [ 7 ]

114 голосов
/ 14 ноября 2009
audio /= np.max(np.abs(audio),axis=0)
image *= (255.0/image.max())

Использование /= и *= позволяет исключить промежуточный временный массив, тем самым экономя часть памяти. Умножение дешевле, чем деление, поэтому

image *= 255.0/image.max()    # Uses 1 division and image.size multiplications

немного быстрее, чем

image /= image.max()/255.0    # Uses 1+image.size divisions

Поскольку мы используем здесь базовые методы numpy, я думаю, что это решение для numpy является настолько эффективным, насколько это возможно.

43 голосов
/ 08 июля 2017

Если массив содержит как положительные, так и отрицательные данные, я бы пошел с:

import numpy as np

a = np.random.rand(3,2)

# Normalised [0,1]
b = (a - np.min(a))/np.ptp(a)

# Normalised [0,255] as integer
c = 255*(a - np.min(a))/np.ptp(a).astype(int)

# Normalised [-1,1]
d = 2.*(a - np.min(a))/np.ptp(a)-1

также стоит упомянуть, даже если это не вопрос OP, стандартизация :

e = (a - np.mean(a)) / np.std(a)
35 голосов
/ 18 января 2014

Вы также можете изменить масштаб, используя sklearn. Преимущества состоят в том, что вы можете настроить нормализацию стандартного отклонения в дополнение к центрированию данных по среднему значению и сделать это по любой оси, по функциям или по записям.

from sklearn.preprocessing import scale
X = scale( X, axis=0, with_mean=True, with_std=True, copy=True )

Аргументы ключевых слов axis, with_mean, with_std не требуют пояснений и отображаются в состоянии по умолчанию. Аргумент copy выполняет операцию на месте, если она установлена ​​на False. Документация здесь .

11 голосов
/ 14 ноября 2009

Вы можете использовать версию "i" (как в idiv, imul ..), и она не выглядит наполовину плохо:

image /= (image.max()/255.0)

В другом случае вы можете написать функцию для нормализации n-мерного массива по столбцам:

def normalize_columns(arr):
    rows, cols = arr.shape
    for col in xrange(cols):
        arr[:,col] /= abs(arr[:,col]).max()
3 голосов
/ 05 апреля 2019

Вы пытаетесь мин-макс масштабировать значения audio между -1 и +1 и image между 0 и 255.

Использование sklearn.preprocessing.minmax_scale должно легко решить вашу проблему.

например:.

audio_scaled = minmax_scale(audio, feature_range=(-1,1))

и

shape = image.shape
image_scaled = minmax_scale(image.ravel(), feature_range=(0,255)).reshape(shape)

note : Не следует путать с операцией, которая масштабирует norm (length) вектора до определенного значения (обычно 1), которое также обычно называют нормализация.

3 голосов
/ 21 февраля 2018

Простое решение - использование инструментов масштабирования, предлагаемых библиотекой sklearn.preprocessing.

scaler = sk.MinMaxScaler(feature_range=(0, 250))
scaler = scaler.fit(X)
X_scaled = scaler.transform(X)
# Checking reconstruction
X_rec = scaler.inverse_transform(X_scaled)

Ошибка X_rec-X будет равна нулю. Вы можете настроить feature_range для своих нужд или даже использовать стандартный скейлер sk.StandardScaler ()

2 голосов
/ 14 мая 2018

Я попытался следовать этому , и получил ошибку

TypeError: ufunc 'true_divide' output (typecode 'd') could not be coerced to provided output parameter (typecode 'l') according to the casting rule ''same_kind''

Массив numpy, который я пытался нормализовать, был integer массивом. Кажется, что они устарели приведения типов в версиях> 1.10, и вы должны использовать numpy.true_divide(), чтобы решить это.

arr = np.array(img)
arr = np.true_divide(arr,[255.0],out=None)

img был PIL.Image объектом.

...