Поиск списка старших элементов в двумерном массиве: Python 3 - PullRequest
0 голосов
/ 01 июля 2018

У меня есть 2D-размер (640X480), подобный этому:

[[1.2 , 9.5 , 4.8 , 1.7],
 [5.5 , 8.1 , 7.6 , 7.1],
 [1.4 , 6.9 , 7.8 , 2.2]]     (this is a sample of a 4X3 array)

Я должен найти 100 (или N) самых высоких значений в массиве самым БЫСТРЫМ возможным способом; поэтому мне нужен наиболее оптимизированный код, который занимает меньше всего времени на обработку.

Поскольку это гигантский массив, хорошо, если я проверил только каждый 2-й элемент или каждый 3-й или 4-й элемент.

Выходные данные алгоритма должны быть списком кортежей, каждый кортеж является двумерным индексом элемента высокого значения.

Например, индекс для 9,5 будет (0,1)

Я нашел решение, но оно слишком медленное:

indexes=[]
for i in range(100):
    highest=-1
    highindex=0.1
    for indi,i in enumerate(array):
        for indj,j in enumerate(i):
            if j>highest and not((indi,indj) in indexes):
                highest= j
                highindex=(indi,indj)
    indexes.append(highindex)

Ответы [ 2 ]

0 голосов
/ 01 июля 2018

С

numpy.argpartition, numpy.unravel_index и numpy.column_stack подпрограммы:

Test ndarray arr - это перетасованный массив со значениями 0 до 99 формы (11, 9).
Допустим, мы хотим найти список двумерных индексов из 7 самых больших значений:

In [1018]: arr
Out[1018]: 
array([[36, 37, 38, 39, 40, 41, 42, 43, 44],
       [27, 28, 29, 30, 31, 32, 33, 34, 35],
       [72, 73, 74, 75, 76, 77, 78, 79, 80],
       [ 0,  1,  2,  3,  4,  5,  6,  7,  8],
       [18, 19, 20, 21, 22, 23, 24, 25, 26],
       [45, 46, 47, 48, 49, 50, 51, 52, 53],
       [ 9, 10, 11, 12, 13, 14, 15, 16, 17],
       [90, 91, 92, 93, 94, 95, 96, 97, 98],
       [54, 55, 56, 57, 58, 59, 60, 61, 62],
       [63, 64, 65, 66, 67, 68, 69, 70, 71],
       [81, 82, 83, 84, 85, 86, 87, 88, 89]])

In [1019]: top_N = 7

In [1020]: idx = np.argpartition(arr, arr.size - top_N, axis=None)[-top_N:]

In [1021]: result = np.column_stack(np.unravel_index(idx, arr.shape))

In [1022]: result
Out[1022]: 
array([[7, 2],
       [7, 3],
       [7, 4],
       [7, 5],
       [7, 7],
       [7, 8],
       [7, 6]])
0 голосов
/ 01 июля 2018

Это решение, о котором я подумал, надеюсь, оно достаточно быстрое для ваших нужд.

num_list = [
    [1.2, 9.5, 4.8, 1.7],
    [5.5, 8.1, 7.6, 7.1],
    [5.5, 9.6, 7.6, 7.1],
    [5.5, 8.1, 4.5, 7.1],
    [1.4, 6.9, 7.8, 12.2]
]

needed_highest = 5 # This is where your 100 would go
highest = [-1] * needed_highest
result = [-1] * needed_highest

for y in range(0, len(num_list)):
    for x in range(0, len(num_list[y])):
        num = num_list[y][x]
        min_index = highest.index(min(highest))
        min_value = highest[min_index]
        if min_value < num:
            highest[min_index] = num
            result[min_index] = (x, y)
print(result)

Результат не сортируется никоим образом, но его не должно быть сложно реализовать, если это необходимо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...