Есть ли лучший способ заставить numpy.argmin () игнорировать значения NaN - PullRequest
16 голосов
/ 12 мая 2010

Я хочу получить индекс минимального значения массива numpy, который содержит NaN, и хочу, чтобы они игнорировались

>>> a = array([ nan,   2.5,   3.,  nan,   4.,   5.])  
>>> a  
array([ NaN,  2.5,  3. ,  NaN,  4. ,  5. ])  

если я запускаю argmin, он возвращает индекс первого NaN

>>> a.argmin()  
0  

Я заменяю NaN на Infs, а затем запускаю argmin

>>> a[isnan(a)] = Inf  
>>> a  
array([ Inf,  2.5,  3. ,  Inf,  4. ,  5. ])  
>>> a.argmin()  
1  

Моя дилемма заключается в следующем: Я бы предпочел не менять NaN на Infs, а потом возвращаться после того, как я закончу с argmin (так как NaNs имеют смысл позже в коде). Есть лучший способ сделать это?

Существует также вопрос о том, каким должен быть результат, если все исходные значения a являются NaN? В моей реализации ответ 0

1 Ответ

31 голосов
/ 12 мая 2010

Конечно! Используйте nanargmin:

import numpy as np
a = np.array([ np.nan,   2.5,   3.,  np.nan,   4.,   5.])
print(np.nanargmin(a))
# 1

Существует также nansum, nanmax, nanargmax и nanmin,

В scipy.stats есть nanmean и nanmedian.

Чтобы узнать больше способов игнорировать nan s, посмотрите массивы в масках .

...