NumPy нарезка с несколькими кортеж - PullRequest
1 голос
/ 27 мая 2019

Рассмотрим следующее:

import numpy as np

arr = np.arange(3 * 4 * 5).reshape((3, 4, 5))

Если я нарежу arr, используя slice с, я получу, например:

arr[:, 0:2, :].shape
# (3, 2, 5)

Если сейчас я нарежу arr, используясмесь slice() и tuple(), я получаю:

arr[:, (0, 1), :].shape
# (3, 2, 5)

np.all(arr[:, (0, 1), :] == arr[:, :2, :])
# True

и:

arr[:, :, (0, 1)].shape
# (3, 4, 2)

np.all(arr[:, :, (0, 1)] == arr[:, :, :2])
# True

ОДНАКО, если я сделаю:

arr[:, (0, 1), (0, 1)].shape
# (3, 2)

, которыйв основном, arr[:, 0, 0] и arr[:, 1, 1] сцеплены.

Я ожидал получить:

arr[:, (0, 1), (0, 1)].shape
# (3, 2, 2)

np.all(arr[:, (0, 1), (0, 1)] == arr[:, :2, :2])
# True

, но это явно не тот случай.

Если я объединюдва отдельных среза, я смог бы получить желаемый результат, а именно:

arr[:, (0, 1), :][:, :, (0, 1)].shape
# (3, 2, 2)

np.all(arr[:, (0, 1), :][:, :, (0, 1)] == arr[:, :2, :2])
# True

Можно ли получить тот же результат, что и arr[:, (0, 1), :][:, :, (0, 1)], но ИСПОЛЬЗУЯ один срез ?

Теперь этот пример не так интересен, потому что я мог бы заменить tuple() на slice(), но если это не так, все это становится намного более уместным, например:

arr[:, (0, 2, 3), :][:, :, (0, 2, 3, 4)]
# [[[ 0  2  3  4]
#   [10 12 13 14]
#   [15 17 18 19]]

#  [[20 22 23 24]
#   [30 32 33 34]
#   [35 37 38 39]]

#  [[40 42 43 44]
#   [50 52 53 54]
#   [55 57 58 59]]]

, для которого arr[:, (0, 2, 3), (0, 2, 3, 4)] будет гораздо более удобным синтаксисом.

РЕДАКТИРОВАТЬ

@ Divakar @hpaulj и @MadPhysicist комментарии / ответы указывают на правильно передаваемую итерацию, чтобы быть эквивалентноймножественного каскадного среза.

Однако это не тот случай, например:

s = np.ix_((0, 1), (0, 1, 2, 3))
arr[s[0], slice(3), s[1]]
# [[[ 0  5 10]
#   [ 1  6 11]
#   [ 2  7 12]
#   [ 3  8 13]]
# 
#  [[20 25 30]
#   [21 26 31]
#   [22 27 32]
#   [23 28 33]]]

Но:

arr[(0, 1), :, :][:, :3, :][:, :, (0, 1, 2, 3)]
# [[[ 0  1  2  3]
#   [ 5  6  7  8]
#   [10 11 12 13]]
# 
#  [[20 21 22 23]
#   [25 26 27 28]
#   [30 31 32 33]]]

и:

np.all(arr[:2, :3, :4] == arr[(0, 1), :, :][:, :3, :][:, :, (0, 1, 2, 3)])
# True

np.all(arr[s[0], slice(3), s[1]] == arr[(0, 1), :, :][:, :3, :][:, :, (0, 1, 2, 3)])
# False

Ответы [ 2 ]

1 голос
/ 27 мая 2019

Если вы хотите получить возможность программно нарезать массив, ответ будет slice объектами, а не последовательностями индексов.Например, :2 становится slice(None, 2):

np.all(arr[:, slice(None, 2), slice(None, 2)] == arr[:, :2, :2])

Срезы выбирают часть оси.Индексные массивы не делают: они выбирают отдельные элементы.Форма индекса определяет форму вывода в этом случае.

Если вы хотите выбрать произвольные индексы по нескольким измерениям, форма массивов индекса должна быть той же самой формы, что и желаемый вывод, или передаваться вэто:

arr[:, [[0], [2], [3]], [[0, 2, 3, 4]]]
0 голосов
/ 28 мая 2019

ix_ может быть объединен со срезом посредством конкатенации кортежей:

In [568]: arr[(slice(None),)+np.ix_((0,2,3),(0,2,3,4))]                                               
Out[568]: 
array([[[ 0,  2,  3,  4],
        [10, 12, 13, 14],
        [15, 17, 18, 19]],

       [[20, 22, 23, 24],
        [30, 32, 33, 34],
        [35, 37, 38, 39]],

       [[40, 42, 43, 44],
        [50, 52, 53, 54],
        [55, 57, 58, 59]]])

Кортеж ix_:

In [569]: np.ix_((0,2,3),(0,2,3,4))                                                                   
Out[569]: 
(array([[0],
        [2],
        [3]]), array([[0, 2, 3, 4]]))

Конкатенация кортежей:

In [570]: (slice(None),)+np.ix_((0,2,3),(0,2,3,4))                                                    
Out[570]: 
(slice(None, None, None), array([[0],
        [2],
        [3]]), array([[0, 2, 3, 4]]))
In [571]: arr[_]                                                                                      
Out[571]: 
array([[[ 0,  2,  3,  4],
        [10, 12, 13, 14],
        [15, 17, 18, 19]],
        ....

Идея создания кортежа с кодом Python и последующего использования его в выражении индексации используется в ряде функций numpy.

Еще один способ создания этого индексационного кортежа:

In [581]: arr[(slice(None), *np.ix_((0,2,3),(0,2,3,4)))]                                              
Out[581]: 
array([[[ 0,  2,  3,  4],
        [10, 12, 13, 14],
        [15, 17, 18, 19]],
       ...

Это использует преимущества распаковки Python '*' внутри кортежа (но не непосредственно в выражении индексации).

Фактически это способ выполнения arr[:,*ix_[...]], который приводит к синтаксической ошибке.

В сумме:

  • numpy работает в Python, поэтому подчиняется всем его синтаксическим правилам

  • numpy, что упрощает индексацию «элемента».Индексирование блоков немного сложнее, хотя на самом деле оно соответствует тем же broadcasting правилам.

  • MATLAB имеет свой собственный язык и синтаксис.Это облегчает индексирование блоков, но индексация элементов, например, получение диагонали, более неудобна, требует дополнительного вызова функции sub2ind.

...