Question

допустим, у меня есть двумерный массив, подобный этому

numpy.array(
    [[0,1,1.2,3],
    [1,5,3.2,4],
    [3,4,2.8,4], 
    [2,6,2.3,5]])

Я хочу сформировать массив, исключающий целые строки на основе уникальности значений последнего столбца, выбирая строку, которую нужно сохранить, основываясь на значении третьего столбца. например в этом случае я хотел бы сохранить только одну из строк с последним столбцом 4 и выбрать ту, которая имеет второстепенное значение третьего столбца, получив в результате что-то подобное:

array([0,1,1.2,3],
      [3,4,2.8,4],
      [2,6,2.3,5])

исключая таким образом строку [1,5,3.2,4]

Какой лучший способ сделать это?

divenex · Answer 1 · 10 декабря 2014

Это может быть эффективно достигнуто в Numpy путем объединения lexsort и unique следующим образом

import numpy as np

a = np.array([[0, 1, 1.2, 3], 
              [1, 5, 3.2, 4],
              [3, 4, 2.8, 4], 
              [2, 6, 2.3, 5]])

# Sort by last column and 3rd column when values are equal
j = np.lexsort(a.T)

# Find first occurrence (=smallest 3rd column) of unique values in last column
k = np.unique(a[j, -1], return_index=True)[1]

print(a[j[k]])

Возвращает желаемый результат

[[ 0.   1.   1.2  3. ]
 [ 3.   4.   2.8  4. ]
 [ 2.   6.   2.3  5. ]]

llimllib · Answer 2 · 22 января 2009

Моя шалость - это выход из практики, но это должно сработать:

#keepers is a dictionary of type int: (int, int)
#the key is the row's final value, and the tuple is (row index, row[2])
keepers = {}
deletions = []
for i, row in enumerate(n):
    key = row[3]
    if key not in keepers:
        keepers[key] = (i, row[2])
    else:
        if row[2] > keepers[key][1]:
            deletions.append(i)
        else:
            deletions.append(keepers[key][0])
            keepers[key] = (i, row[2])
o = numpy.delete(n, deletions, axis=0)

Я значительно упростил это из своего декларативного решения, которое становилось довольно громоздким. Надеюсь, это легче следовать; все, что мы делаем, это поддерживаем словарь значений, которые мы хотим сохранить, и список индексов, которые мы хотим удалить.

удаление строк массива numpy на основе уникальности значения

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

удаление строк массива numpy на основе уникальности значения

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы