Как разрезать массив Numpy по значению столбца - PullRequest
2 голосов
/ 28 сентября 2011

У меня есть такой массив:

 dd =[[0.567 2 0.611]
      [0.469 1 0.479]
      [0.220 2 0.269]
      [0.480 1 0.508]
      [0.324 1 0.324]]

Мне нужно 2 отдельных массива dd[:,1] ==1 и dd[:,1] ==2

Эти массивы - то, что мне нужно:

 na =[[0.469 1 0.479]
      [0.480 1 0.508]
      [0.324 1 0.324]]

 na2 =[[0.567 2 0.611]
       [0.220 2 0.269]]

Я пытался np.where действительно работал

1 Ответ

6 голосов
/ 28 сентября 2011

Вы можете использовать необычное индексирование:

[~/repo/py]
|32>dd[dd[:,1] == 1]
[32] 
array([[ 0.469,  1.   ,  0.479],
       [ 0.48 ,  1.   ,  0.508],
       [ 0.324,  1.   ,  0.324]])

[~/repo/py]
|33>dd[dd[:,1] == 2]
[33] 
array([[ 0.567,  2.   ,  0.611],
       [ 0.22 ,  2.   ,  0.269]])

В качестве альтернативы вы можете использовать понимание списка:

[~/repo/py]
|21>np.array([row for row in dd if row[1] == 1])
[21] 
array([[ 0.469,  1.   ,  0.479],
       [ 0.48 ,  1.   ,  0.508],
       [ 0.324,  1.   ,  0.324]])

[~/repo/py]
|22>np.array([row for row in dd if row[1] == 2])
[22] 
array([[ 0.567,  2.   ,  0.611],
       [ 0.22 ,  2.   ,  0.269]])

edit:

как рассчитать эти вещи в ipython:

[~/repo/py]
|36>timeit dd[dd[:,1] == 1]
100000 loops, best of 3: 6 us per loop

[~/repo/py]
|37>timeit np.array([row for row in dd if row[1] == 1])
100000 loops, best of 3: 11.5 us per loop
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...