Как получить последнее ненулевое значение массива NumPy? - PullRequest
0 голосов
/ 11 декабря 2018

Я работаю над моделью.Результаты сохраняются в файле NetCFD с замаскированными данными lon, lat и времени на частицу.Я хочу получить последнее реальное значение lon, lat, time для каждой частицы.Мне удалось получить позицию последнего действительного числа, но не само значение.

У вас есть предложения?

Мой код выглядит так:

lat1= masked_array(data=[[-14.33945369720459, -14.33945369720459, -14.339454650878906,
     -14.339454650878906, -14.339454650878906, -14.339454650878906,
     -14.339454650878906, -14.339454650878906, -14.339457511901855,
     -14.339459419250488, -14.339459419250488, -14.339459419250488,
     --, --, --, --, --, --, --, --],
    [-5.621851444244385, -5.621865272521973, -5.621881008148193,
     -5.621898651123047, -5.621916770935059, -5.621936321258545,
     -5.6219563484191895, -5.621973037719727, -5.621990203857422,
     -5.622012615203857, -5.622034072875977, -5.622053146362305, --,
     --, --, --, --, --, --, --]], mask=[[False, False, False, False, False, False, False, False, False,
     False, False, False,  True,  True,  True,  True,  True,  True,
      True,  True],
    [False, False, False, False, False, False, False, False, False,
     False, False, False,  True,  True,  True,  True,  True,  True,
      True,  True]], fill_value=nan, dtype=float32)         #latitude values of 2 particles


def last_nonzero(lat1, axis, invalid_val=-9999):
    mask = lat1!=0
    val = lat1.shape[axis] - np.flip(mask, axis=axis).argmax(axis=axis) - 1
    return np.where(mask.any(axis=axis), val, invalid_val)

last_nonzero(lat1, axis=1, invalid_val=-9999)        #for each particle, gives the position of the last real number
print lat1[last_nonzero(lat1, axis=1, invalid_val=-9999)]

1 Ответ

0 голосов
/ 11 декабря 2018

Если я правильно понимаю, вы могли бы сделать следующее:

  1. Получить индексы последних ненулевых элементов (вы уже знаете, как их получить):

    >>> last_nonzero_indices = last_nonzero(lat1, axis=1, invalid_val=-9999)
    >>> last_nonzero_indices
    array([11, 11], dtype=int64)
    
  2. Получите только действительные записи вашего исходного массива:

    >>> valid_values = lat1[~lat1.mask]
    >>> valid_values
    masked_array(data=[-14.33945369720459, -14.33945369720459,
                       -14.339454650878906, -14.339454650878906,
                       -14.339454650878906, -14.339454650878906,
                       -14.339454650878906, -14.339454650878906,
                       -14.339457511901855, -14.339459419250488,
                       -14.339459419250488, -14.339459419250488,
                       -5.621851444244385, -5.621865272521973,
                       -5.621881008148193, -5.621898651123047,
                       -5.621916770935059, -5.621936321258545,
                       -5.6219563484191895, -5.621973037719727,
                       -5.621990203857422, -5.622012615203857,
                       -5.622034072875977, -5.622053146362305],
                 mask=[False, False, False, False, False, False, False, False,
                       False, False, False, False, False, False, False, False,
                       False, False, False, False, False, False, False, False],
           fill_value=nan,
                dtype=float32)
    
  3. Поскольку возвращаемый массив сглаживается, вычислите соответствующие индексы из индексов, которые мывычислено ранее:

    >>> last_nonzero_indices = np.cumsum(last_nonzero_indices)
    >>> last_nonzero_indices
    array([11, 22], dtype=int64)
    
  4. Получите нужные последние ненулевые значения:

    >>> valid_values[last_nonzero_indices]
    masked_array(data=[-14.339459419250488, -5.622034072875977],
                 mask=[False, False],
           fill_value=nan,
                dtype=float32)
    

Мне не очень нравится это решениехотя и надеюсь, что кто-то, обладающий лучшими знаниями о масках в масках, сможет предложить что-то лучшее.

...