Объединить 2D список замаскированных массивов различной длины - PullRequest
0 голосов
/ 12 мая 2018

У меня очень большой список замаскированных массивов, которые я хочу объединить вместе, но массивы имеют разную длину.Для простоты это то, что я хочу сделать, я хочу получить C:

A=[[--,--,--,...,--]
   [1,2,3,...,--,--],
   ...
B=[[--,--,--,...,--],
   [4,5,6,...,--,--],
   ...
C=A+B
C=[[--,--,--,...,--,--,--,--,...,--],
   [1,2,3,...,--,--,4,5,6,...,--,--],
   ...
len(A)= 81
len(B)= 81
len(A[0])=2700
len(B[0])= 5000

len(C) = 81
len(C[0])= 7700

Так что я просто помещаю два списка рядом друг с другом.В действительности, мой массив A выглядит следующим образом (B похож):

masked_array(
  data=[[--, --, --, ..., --, --, --],
    [--, --, --, ..., --, --, --],
    [--, --, --, ..., --, --, --],
    ...,
    [-3.6872851848602295, -3.732004165649414, -3.7555367946624756,
     ..., -3.8215177059173584, -3.7747914791107178,
     -3.819281816482544],
    [-3.819749116897583, -3.824702739715576, -3.804812431335449, ...,
     -3.863957643508911, -3.840423345565796, -3.8660500049591064],
    [-3.6894078254699707, -3.7181897163391113, -3.7022457122802734,
     ..., -3.8167803287506104, -3.7095720767974854,
     -3.8254523277282715]],
  mask=[[ True,  True,  True, ...,  True,  True,  True],
    [ True,  True,  True, ...,  True,  True,  True],
    [ True,  True,  True, ...,  True,  True,  True],
    ...,
    [False, False, False, ..., False, False, False],
    [False, False, False, ..., False, False, False],
    [False, False, False, ..., False, False, False]],
  fill_value=9.96921e+36,
  dtype=float32)

Проблема в том, что большинство команд не работают либо потому, что это маскированный массив, либо потому, что он имеет разные размеры.Я уже проверил эти вопросы:

Любая помощь приветствуется!

Ответы [ 2 ]

0 голосов
/ 12 мая 2018

Один из вариантов - использовать обычные операции над данными и маскировать по отдельности:

c_data = np.hstack((a.data, b.data))
c_mask = np.hstack((a.mask, b.mask))
c = ma.array(c_data, mask=c_mask)
0 голосов
/ 12 мая 2018

Давайте предположим, что у нас есть

import numpy as np
import numpy.ma as ma

# create a 3 x 4 masked array
a = np.arange(12).reshape(3, 4)
a = ma.masked_where(a % 3 == 0, a)
# masked_array(
#  data=[[--, 1, 2, --],
#         [4, 5, --, 7],
#         [8, --, 10, 11]],
#   mask=[[ True, False, False,  True],
#         [False, False,  True, False],
#         [False,  True, False, False]],
#   fill_value=999999)


# create a 3 x 5 masked array
b = np.arange(15).reshape(3,5)
b = ma.masked_where(b % 2 == 0, b)
# masked_array(
#   data=[[--, 1, --, 3, --],
#         [5, --, 7, --, 9],
#         [--, 11, --, 13, --]],
#   mask=[[ True, False,  True, False,  True],
#         [False,  True, False,  True, False],
#         [ True, False,  True, False,  True]],
#   fill_value=999999)

Тогда вы можете использовать numpy.ma.hstack, чтобы добавить их по горизонтали и сохранить маски:

ma.hstack([a, b])

приводит к

masked_array(
  data=[[--, 1, 2, --, --, 1, --, 3, --],
        [4, 5, --, 7, 5, --, 7, --, 9],
        [8, --, 10, 11, --, 11, --, 13, --]],
  mask=[[ True, False, False,  True,  True, False,  True, False,  True],
        [False, False,  True, False, False,  True, False,  True, False],
        [False,  True, False, False,  True, False,  True, False,  True]],
  fill_value=999999)
...