Как применить numpy.linalg.norm к каждой строке матрицы? - PullRequest
61 голосов
/ 12 октября 2011

У меня есть 2D матрица, и я хочу взять норму каждой строки.Но когда я использую numpy.linalg.norm(X) напрямую, это берет норму всей матрицы.

Я могу взять норму для каждой строки, используя цикл for, а затем взять норму для каждого X[i], но это занимает огромное время, так как у меня 30k строк.

Любые предложения, чтобы найтиболее быстрый способ?Или можно применить np.linalg.norm к каждой строке матрицы?

Ответы [ 4 ]

75 голосов
/ 12 октября 2011

Обратите внимание, что, как показывает perimosocordiae , начиная с NumPy версии 1.9, np.linalg.norm(x, axis=1) - самый быстрый способ вычисления L2-нормы.


Если вы вычисляетеL2-норма, вы можете вычислить ее напрямую (используя аргумент axis=-1 для суммирования по строкам):

np.sum(np.abs(x)**2,axis=-1)**(1./2)

Lp-нормы можно вычислить аналогично, конечно.

Это значительнобыстрее, чем np.apply_along_axis, хотя, возможно, не так удобно:

In [48]: %timeit np.apply_along_axis(np.linalg.norm, 1, x)
1000 loops, best of 3: 208 us per loop

In [49]: %timeit np.sum(np.abs(x)**2,axis=-1)**(1./2)
100000 loops, best of 3: 18.3 us per loop

Другие ord формы norm также могут быть вычислены напрямую (с аналогичными ускорениями):

In [55]: %timeit np.apply_along_axis(lambda row:np.linalg.norm(row,ord=1), 1, x)
1000 loops, best of 3: 203 us per loop

In [54]: %timeit np.sum(abs(x), axis=-1)
100000 loops, best of 3: 10.9 us per loop
44 голосов
/ 05 ноября 2013

Воскрешение старого вопроса из-за большого количества обновлений. Начиная с версии 1.9, numpy.linalg.norm теперь принимает аргумент axis. [ код , документация ]

Это новый самый быстрый метод в городе:

In [10]: x = np.random.random((500,500))

In [11]: %timeit np.apply_along_axis(np.linalg.norm, 1, x)
10 loops, best of 3: 21 ms per loop

In [12]: %timeit np.sum(np.abs(x)**2,axis=-1)**(1./2)
100 loops, best of 3: 2.6 ms per loop

In [13]: %timeit np.linalg.norm(x, axis=1)
1000 loops, best of 3: 1.4 ms per loop

И чтобы доказать, что он вычисляет то же самое:

In [14]: np.allclose(np.linalg.norm(x, axis=1), np.sum(np.abs(x)**2,axis=-1)**(1./2))
Out[14]: True
10 голосов
/ 10 июля 2017

Гораздо быстрее, чем принятый ответ

numpy.sqrt(numpy.einsum('ij,ij->i', a, a))

Обратите внимание на лог-шкалу:

enter image description here


Кодвоспроизвести сюжет:

import numpy
import perfplot


def sum_sqrt(a):
    return numpy.sqrt(numpy.sum(numpy.abs(a)**2, axis=-1))


def apply_norm_along_axis(a):
    return numpy.apply_along_axis(numpy.linalg.norm, 1, a)


def norm_axis(a):
    return numpy.linalg.norm(a, axis=1)


def einsum_sqrt(a):
    return numpy.sqrt(numpy.einsum('ij,ij->i', a, a))


perfplot.show(
    setup=lambda n: numpy.random.rand(n, 3),
    kernels=[sum_sqrt, apply_norm_along_axis, norm_axis, einsum_sqrt],
    n_range=[2**k for k in range(20)],
    logx=True,
    logy=True,
    xlabel='len(a)'
    )
6 голосов
/ 12 октября 2011

Попробуйте выполнить следующее:

In [16]: numpy.apply_along_axis(numpy.linalg.norm, 1, a)
Out[16]: array([ 5.38516481,  1.41421356,  5.38516481])

, где a - ваш 2D-массив.

Вышеприведенное вычисляет норму L2.Для другой нормы вы можете использовать что-то вроде:

In [22]: numpy.apply_along_axis(lambda row:numpy.linalg.norm(row,ord=1), 1, a)
Out[22]: array([9, 2, 9])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...