замаскировать двумерный массивный массив на основе значений в одном столбце - PullRequest
11 голосов
/ 07 января 2011

Предположим, у меня есть следующий массив NumPy:

a = [[1, 5, 6],
     [2, 4, 1],
     [3, 1, 5]]

Я хочу замаскировать все строки с 1 в первом столбце.То есть я хочу

   [[--, --, --],
     [2, 4, 1],
     [3, 1, 5]]

Можно ли это сделать с помощью операций с массивными масками?Как можно это сделать?

Спасибо.

Ответы [ 3 ]

7 голосов
/ 07 января 2011
import numpy as np

a = np.array([[1, 5, 6],
              [2, 4, 1],
              [3, 1, 5]])

np.ma.MaskedArray(a, mask=(np.ones_like(a)*(a[:,0]==1)).T)

# Returns: 
masked_array(data =
 [[-- -- --]
 [2 4 1]
 [3 1 5]],
             mask =
 [[ True  True  True]
 [False False False]
 [False False False]])
3 голосов
/ 07 января 2011

Вы можете создать желаемую маску с помощью

mask = numpy.repeat(a[:,0]==1, a.shape[1])

и замаскированный массив

masked_a = numpy.ma.array(a, mask=numpy.repeat(a[:,0]==1, a.shape[1]))
1 голос
/ 16 декабря 2016

Вы можете просто создать пустую маску и затем использовать широковещательную трансляцию (как показало @eumiro), но используя элементный и побитовый оператор "или" |:

>>> a = np.array([[1, 5, 6], [2, 4, 1], [3, 1, 5]])

>>> mask = np.zeros(a.shape, bool) | (a[:, 0] == 1)[:, None]

>>> np.ma.array(a, mask=mask)
masked_array(data =
 [[-- -- --]
 [2 4 1]
 [3 1 5]],
             mask =
 [[ True  True  True]
 [False False False]
 [False False False]],
       fill_value = 999999)

Немного дальнейшего объяснения:

>>> # select first column
>>> a[:, 0]  
array([1, 2, 3])

>>> # where the first column is 1
>>> a[:, 0] == 1  
array([ True, False, False], dtype=bool)

>>> # added dimension so that it correctly broadcasts to the empty mask
>>> (a[:, 0] == 1)[:, None]  
array([[ True],
       [False],
       [False]], dtype=bool)

>>> # create the final mask
>>> np.zeros(a.shape, bool) | (a[:, 0] == 1)[:, None]  
array([[ True,  True,  True],
       [False, False, False],
       [False, False, False]], dtype=bool)

Еще одно преимущество этого подхода заключается в том, что ему не нужно использовать потенциально дорогостоящие умножения или np.repeat, поэтому он должен быть довольно быстрым.

...