Отображение массива NumPy на месте - PullRequest
50 голосов
/ 26 июля 2011

Можно ли отобразить массив NumPy на месте?Если да, то как?

Учитывая a_values - 2D массив - это бит кода, который помогает мне в данный момент:

for row in range(len(a_values)):
    for col in range(len(a_values[0])):
        a_values[row][col] = dim(a_values[row][col])

Но это такуродливо, что я подозреваю, что где-то внутри NumPy должна существовать функция, которая делает то же самое с чем-то, похожим на:

a_values.map_in_place(dim)

, но если что-то подобное существует, я не смог найти его.

Ответы [ 5 ]

51 голосов
/ 26 июля 2011

Стоит попробовать сделать это на месте, только если вы находитесь в условиях ограниченного пространства. Если это так, то можно немного ускорить ваш код, выполняя итерацию по сглаженному представлению массива. Поскольку reshape возвращает новое представление , когда это возможно , сами данные не копируются (если оригинал не имеет необычной структуры).

Я не знаю лучшего способа добиться добросовестного применения произвольной функции Python на месте.

>>> def flat_for(a, f):
...     a = a.reshape(-1)
...     for i, v in enumerate(a):
...         a[i] = f(v)
... 
>>> a = numpy.arange(25).reshape(5, 5)
>>> flat_for(a, lambda x: x + 5)
>>> a

array([[ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19],
       [20, 21, 22, 23, 24],
       [25, 26, 27, 28, 29]])

Некоторые тайминги:

>>> a = numpy.arange(2500).reshape(50, 50)
>>> f = lambda x: x + 5
>>> %timeit flat_for(a, f)
1000 loops, best of 3: 1.86 ms per loop

Это примерно вдвое быстрее, чем версия с вложенным циклом:

>>> a = numpy.arange(2500).reshape(50, 50)
>>> def nested_for(a, f):
...     for i in range(len(a)):
...         for j in range(len(a[0])):
...             a[i][j] = f(a[i][j])
... 
>>> %timeit nested_for(a, f)
100 loops, best of 3: 3.79 ms per loop

Конечно, векторизация еще быстрее, поэтому, если вы можете сделать копию, используйте это:

>>> a = numpy.arange(2500).reshape(50, 50)
>>> g = numpy.vectorize(lambda x: x + 5)
>>> %timeit g(a)
1000 loops, best of 3: 584 us per loop

И если вы можете переписать dim с помощью встроенных ufuncs, то, пожалуйста, не надо vectorize:

>>> a = numpy.arange(2500).reshape(50, 50)
>>> %timeit a + 5
100000 loops, best of 3: 4.66 us per loop

numpy выполняет такие операции, как += на месте, как и следовало ожидать - так что вы можете получить скорость ufunc с приложением на месте без каких-либо затрат. Иногда это даже быстрее! См. здесь для примера.


Кстати, мой первоначальный ответ на этот вопрос, который можно увидеть в истории его редактирования, смешен и включает в себя векторизацию индексов в a. Мало того, что он должен был сделать что-то напуганное, чтобы обойти vectorize механизм определения типа , он оказался таким же медленным, как версия с вложенным циклом. Так много за ум!

44 голосов
/ 26 июля 2011

Это список статей, разбросанных по ответам и комментарии, которые я написал после принятия ответа на вопрос. Проголосовать всегда приветствуется, но если вы проголосуете за этот ответ, пожалуйста, не пропустите, чтобы поддержать также те из senderle и (если он пишет) один) eryksun , который предложил методы ниже.

В: Можно ли отобразить массив numpy на месте?
A: Да, но не с одним методом массива . Вы должны написать свой собственный код.

Ниже сценария, который сравнивает различные реализации, обсужденные в потоке:

import timeit
from numpy import array, arange, vectorize, rint

# SETUP
get_array = lambda side : arange(side**2).reshape(side, side) * 30
dim = lambda x : int(round(x * 0.67328))

# TIMER
def best(fname, reps, side):
    global a
    a = get_array(side)
        t = timeit.Timer('%s(a)' % fname,
                     setup='from __main__ import %s, a' % fname)
    return min(t.repeat(reps, 3))  #low num as in place --> converge to 1

# FUNCTIONS
def mac(array_):
    for row in range(len(array_)):
        for col in range(len(array_[0])):
            array_[row][col] = dim(array_[row][col])

def mac_two(array_):
    li = range(len(array_[0]))
    for row in range(len(array_)):
        for col in li:
            array_[row][col] = int(round(array_[row][col] * 0.67328))

def mac_three(array_):
    for i, row in enumerate(array_):
        array_[i][:] = [int(round(v * 0.67328)) for v in row]


def senderle(array_):
    array_ = array_.reshape(-1)
    for i, v in enumerate(array_):
        array_[i] = dim(v)

def eryksun(array_):
    array_[:] = vectorize(dim)(array_)

def ufunc_ed(array_):
    multiplied = array_ * 0.67328
    array_[:] = rint(multiplied)

# MAIN
r = []
for fname in ('mac', 'mac_two', 'mac_three', 'senderle', 'eryksun', 'ufunc_ed'):
    print('\nTesting `%s`...' % fname)
    r.append(best(fname, reps=50, side=50))
    # The following is for visually checking the functions returns same results
    tmp = get_array(3)
    eval('%s(tmp)' % fname)
    print tmp
tmp = min(r)/100
print('\n===== ...AND THE WINNER IS... =========================')
print('  mac (as in question)       :  %.4fms [%.0f%%]') % (r[0]*1000,r[0]/tmp)
print('  mac (optimised)            :  %.4fms [%.0f%%]') % (r[1]*1000,r[1]/tmp)
print('  mac (slice-assignment)     :  %.4fms [%.0f%%]') % (r[2]*1000,r[2]/tmp)
print('  senderle                   :  %.4fms [%.0f%%]') % (r[3]*1000,r[3]/tmp)
print('  eryksun                    :  %.4fms [%.0f%%]') % (r[4]*1000,r[4]/tmp)
print('  slice-assignment w/ ufunc  :  %.4fms [%.0f%%]') % (r[5]*1000,r[5]/tmp)
print('=======================================================\n')

Вывод вышеупомянутого скрипта - по крайней мере, в моей системе -:

  mac (as in question)       :  88.7411ms [74591%]
  mac (optimised)            :  86.4639ms [72677%]
  mac (slice-assignment)     :  79.8671ms [67132%]
  senderle                   :  85.4590ms [71832%]
  eryksun                    :  13.8662ms [11655%]
  slice-assignment w/ ufunc  :  0.1190ms [100%]

Как вы можете заметить, при использовании numpy's ufunc увеличивает скорость более чем на 2 и почти на 3 порядка по сравнению со вторым лучшим и худшим вариантом соответственно.

Если использовать ufunc не вариант, вот сравнение только других альтернатив:

  mac (as in question)       :  91.5761ms [672%]
  mac (optimised)            :  88.9449ms [653%]
  mac (slice-assignment)     :  80.1032ms [588%]
  senderle                   :  86.3919ms [634%]
  eryksun                    :  13.6259ms [100%]

НТН!

3 голосов
/ 29 июля 2011

Почему бы не использовать numpy реализацию, а трюк out_?

from numpy import array, arange, vectorize, rint, multiply, round as np_round 

def fmilo(array_):
    np_round(multiply(array_ ,0.67328, array_), out=array_)

есть:

===== ...AND THE WINNER IS... =========================
  mac (as in question)       :  80.8470ms [130422%]
  mac (optimised)            :  80.2400ms [129443%]
  mac (slice-assignment)     :  75.5181ms [121825%]
  senderle                   :  78.9380ms [127342%]
  eryksun                    :  11.0800ms [17874%]
  slice-assignment w/ ufunc  :  0.0899ms [145%]
  fmilo                      :  0.0620ms [100%]
=======================================================
2 голосов
/ 27 июля 2011

если ufuncs невозможен, возможно, вам стоит подумать об использовании cython. его легко интегрировать и значительно ускорить конкретное использование массивов numpy.

1 голос
/ 30 июля 2017

Это просто обновленная версия написания Mac, актуализированная для Python 3.x, с добавлением numba и numpy.frompyfunc .

numpy.frompyfunc принимает произвольную функцию python и возвращает функцию, которая при приведении к numpy.array применяет функцию поэлементно.
Однако он изменяет тип данных массива на объект, поэтому он не на месте, и будущие вычисления для этого массива будут выполняться медленнее.
Чтобы избежать этого недостатка, в тесте будет вызываться numpy.ndarray.astype , возвращающий тип данных в int.

В качестве примечания:
Numba не входит в базовые библиотеки Python и должен быть загружен извне, если вы хотите его протестировать.В этом тесте он фактически ничего не делает, и если бы он был вызван с помощью @ jit (nopython = True) , он бы выдал сообщение об ошибке, в котором говорится, что он не может ничего оптимизировать.Однако, поскольку numba часто ускоряет код, написанный в функциональном стиле, он включен для целостности.

import timeit
from numpy import array, arange, vectorize, rint, frompyfunc
from numba import autojit

# SETUP
get_array = lambda side : arange(side**2).reshape(side, side) * 30
dim = lambda x : int(round(x * 0.67328))

# TIMER
def best(fname, reps, side):
    global a
    a = get_array(side)
    t = timeit.Timer('%s(a)' % fname,
                     setup='from __main__ import %s, a' % fname)
    return min(t.repeat(reps, 3))  #low num as in place --> converge to 1

# FUNCTIONS
def mac(array_):
    for row in range(len(array_)):
        for col in range(len(array_[0])):
            array_[row][col] = dim(array_[row][col])

def mac_two(array_):
    li = range(len(array_[0]))
    for row in range(len(array_)):
        for col in li:
            array_[row][col] = int(round(array_[row][col] * 0.67328))

def mac_three(array_):
    for i, row in enumerate(array_):
        array_[i][:] = [int(round(v * 0.67328)) for v in row]


def senderle(array_):
    array_ = array_.reshape(-1)
    for i, v in enumerate(array_):
        array_[i] = dim(v)

def eryksun(array_):
    array_[:] = vectorize(dim)(array_)

@autojit
def numba(array_):
    for row in range(len(array_)):
        for col in range(len(array_[0])):
            array_[row][col] = dim(array_[row][col])


def ufunc_ed(array_):
    multiplied = array_ * 0.67328
    array_[:] = rint(multiplied)

def ufunc_frompyfunc(array_):
    udim = frompyfunc(dim,1,1)
    array_ = udim(array_)
    array_.astype("int")

# MAIN
r = []
totest = ('mac', 'mac_two', 'mac_three', 'senderle', 'eryksun', 'numba','ufunc_ed','ufunc_frompyfunc')
for fname in totest:
    print('\nTesting `%s`...' % fname)
    r.append(best(fname, reps=50, side=50))
    # The following is for visually checking the functions returns same results
    tmp = get_array(3)
    eval('%s(tmp)' % fname)
    print (tmp)
tmp = min(r)/100
results = list(zip(totest,r))
results.sort(key=lambda x: x[1])

print('\n===== ...AND THE WINNER IS... =========================')
for name,time in results:
    Out = '{:<34}: {:8.4f}ms [{:5.0f}%]'.format(name,time*1000,time/tmp)
    print(Out)
print('=======================================================\n')



И, наконец, результаты:

===== ...AND THE WINNER IS... =========================
ufunc_ed                          :   0.3205ms [  100%]
ufunc_frompyfunc                  :   3.8280ms [ 1194%]
eryksun                           :   3.8989ms [ 1217%]
mac_three                         :  21.4538ms [ 6694%]
senderle                          :  22.6421ms [ 7065%]
mac_two                           :  24.6230ms [ 7683%]
mac                               :  26.1463ms [ 8158%]
numba                             :  27.5041ms [ 8582%]
=======================================================
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...