можно разделить массив numpy с помощью маски? - PullRequest
6 голосов
/ 27 марта 2020

Я хочу разделить массив на массив с маской и индексом
, как показано ниже

a = array([ 0,  1,  2,  3,  4, 5]))  
b = [0,2,3]  

на

c = array([[0, 2, 3], [1, 3, 4], [2, 4, 5]])  

Могу ли я сделать это без l oop?

Редактировать:

Больше примеров ...

Скажем, у нас есть массив a с формой [10, 10, 10]
, где a[x, y, :] = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

Теперь с учетом маски b = [0, 3, 7]

Я хочу, чтобы вывод был массивом c с формой [10, 10, 3, 3]
, где c[x, y, :, :] = [[0, 3, 7], [1, 4, 8], [2, 5, 9]]

Ответы [ 3 ]

6 голосов
/ 27 марта 2020

создайте временный массив с удвоенным размером и дважды скопируйте наш элемент массива в новый массив, а затем скопируйте элемент из нового массива в наш массив, взяв поворот в качестве начального индекса до длины нашего массива.

3 голосов
/ 27 марта 2020

Вы можете сгенерировать b в виде широковещательной суммы между нужными индексами и вектором смещения. Затем вы можете снова транслировать в большем размере. Поскольку выходные данные в ваших примерах не зависят от массива a, я не обращаю на это внимания.

from numpy import array, broadcast_to, arange
from numpy.random import random

a = random((10,10,10)) # not used on the code at all.... don't understand what it is for...

b = [0,2,3]
b_array = array(b)
b_shifts = arange(3).reshape(-1,1)
c_cell= b+b_shifts # here, they are broadcasted toegether. one is a row-vector and one is a column-vector...
c = broadcast_to(c_cell,(10,10,3,3))

вы можете создать b_shifts другим методом, зависящим от размера шага и т. Д. ...


РЕДАКТИРОВАТЬ Судя по вашим комментариям, более точный ответ выглядит так:

from numpy import array, arange
a = arange(2*2*10).reshape((2,2,10)) # some example input 
b = array([0,2,3])                   # the 'template' to extract
shifts = arange(3).reshape(-1,1)     # 3 is the number of repeats
indexer = b+shifts                   # broadcasted sum makes a matrix
c = a[:,:,indexer]                   # extract

Это будет принимать массив b как своего рода шаблон, и повторите его с определенным сдвигом. Наконец, он извлечет эти записи из каждого массива a[i,j,:] в c[i,j,:,:]. Отпуск сверху:

print(a)

[[[ 0  1  2  3  4  5  6  7  8  9]
  [10 11 12 13 14 15 16 17 18 19]]
 [[20 21 22 23 24 25 26 27 28 29]
  [30 31 32 33 34 35 36 37 38 39]]]

print(c)

[[[[ 0  2  3]
   [ 1  3  4]
   [ 2  4  5]]
  [[10 12 13]
   [11 13 14]
   [12 14 15]]]
 [[[20 22 23]
   [21 23 24]
   [22 24 25]]
  [[30 32 33]
   [31 33 34]
   [32 34 35]]]]
2 голосов
/ 27 марта 2020

Подвижной windows подход с использованием as_strided:

In [1]: a = np.arange(6)                                                                       
In [2]: a                                                                                      
Out[2]: array([0, 1, 2, 3, 4, 5])
In [3]: as_strided = np.lib.stride_tricks.as_strided                                           

Для этой односменной работы параметр strides прост. shape требует большего размышления - сколько строк мы ожидаем, и максимальный индекс:

In [5]: b = as_strided(a, shape=(3,4), strides=(8,8))                                          
In [6]: b                                                                                      
Out[6]: 
array([[0, 1, 2, 3],
       [1, 2, 3, 4],
       [2, 3, 4, 5]])

Затем выберите столбцы:

In [8]: b[:,[0,2,3]]                                                                           
Out[8]: 
array([[0, 2, 3],
       [1, 3, 4],
       [2, 4, 5]])

Чтобы расширить его до трехмерного случая, я Вы будете работать с { ссылка }, ответ LudvigH

In [10]: a = np.arange(2*2*10).reshape((2,2,10)) # some example input  
    ...: b = np.array([0,2,3])                                                                 
In [11]: a                                                                                     
Out[11]: 
array([[[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9],
        [10, 11, 12, 13, 14, 15, 16, 17, 18, 19]],

       [[20, 21, 22, 23, 24, 25, 26, 27, 28, 29],
        [30, 31, 32, 33, 34, 35, 36, 37, 38, 39]]])
In [12]: a.shape                                                                               
Out[12]: (2, 2, 10)
In [13]: a.strides                                                                             
Out[13]: (160, 80, 8)
In [18]: a1 = as_strided(a, shape=(2,2,3,4), strides=(160,80,8,8))                             
In [19]: a1                                                                                    
Out[19]: 
array([[[[ 0,  1,  2,  3],
         [ 1,  2,  3,  4],
         [ 2,  3,  4,  5]],

        [[10, 11, 12, 13],
         [11, 12, 13, 14],
         [12, 13, 14, 15]]],


       [[[20, 21, 22, 23],
         [21, 22, 23, 24],
         [22, 23, 24, 25]],

        [[30, 31, 32, 33],
         [31, 32, 33, 34],
         [32, 33, 34, 35]]]])

Это всего лишь продолжение первого случая, когда первые два измерения просто идут вместе для поездки. Это последние измерения, которые развернулись в 2-мерное окно.

Снова выбираем подмножество столбцов:

In [20]: a1[:,:,:,b]                                                                           
Out[20]: 
array([[[[ 0,  2,  3],
         [ 1,  3,  4],
         [ 2,  4,  5]],

        [[10, 12, 13],
         [11, 13, 14],
         [12, 14, 15]]],


       [[[20, 22, 23],
         [21, 23, 24],
         [22, 24, 25]],

        [[30, 32, 33],
         [31, 33, 34],
         [32, 34, 35]]]])

Шаг as_strided эффективен, создавая view. Но индексация сделает копию. Нам нужно было бы потратить некоторое время, чтобы проверить это с помощью подхода LudvigH со смещенным индексом.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...