Векторизованный способ добавления нескольких перекрывающихся кубов - PullRequest
0 голосов
/ 27 августа 2018

Я использую раздвижные окна для глубокого изучения большого прямоугольного изображения. Изображение имеет форму (высота, ширина).

Вывод прогноза представляет собой массив данных (высота, ширина, предсказание_проблемость). Мои прогнозы выводятся в перекрывающихся окнах, которые мне нужно сложить, чтобы получить попиксельные прогнозы для всего входного изображения. Окна перекрываются более чем на 2 пикселя в (высота, ширина).

В C ++ ранее я делал такие вещи, создав большой индекс результатов и затем сложив все ROI вместе.

#include <opencv2/core/core.hpp>
using namespace std;  

template <int numberOfChannels>
static void AddBlobToBoard(Mat& board, vector<float> blobData,
                                            int blobWidth, int blobHeight,
                                            Rect roi) {
 for (int y = roi.y; y < roi.y + roi.height; y++) {
    auto vecPtr = board.ptr< Vec <float, numberOfChannels> >(y);
    for (int x = roi.x; x < roi.x + roi.width; x++) {
      for (int channel = 0; channel < numberOfChannels; channel++) {
          vecPtr[x][channel] +=
            blobData[(band * blobHeight + y - roi.y) * blobWidth + x - roi.x];}}}

Есть ли в Python векторный способ сделать это?

1 Ответ

0 голосов
/ 28 августа 2018

Редактировать:

@ Кевин ИМО, если вы все равно тренируете сеть, вы должны выполнить этот шаг с полностью подключенным слоем. что сказал ..

У меня есть не векторизованное решение, если вы хотите с чем-то работать. Любое решение будет интенсивно использовать память. На моем ноутбуке он работает довольно быстро для серых изображений размера CIFAR (32x32). Может быть, кто-то умный может векторизовать ключевой шаг

Сначала разбейте тестовый массив arr на окна win, используя skimage. Это тестовые данные.

>>> import numpy as np
>>> from skimage.util.shape import view_as_windows as viewW
>>> arr = np.arange(20).reshape(5,4)
>>> win = viewW(arr, (3,3))
>>> arr # test data 
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15],
       [16, 17, 18, 19]])
>>> win[0,0]==arr[:3,:3] # it works. 
array([[ True,  True,  True],
       [ True,  True,  True],
       [ True,  True,  True]])

Теперь для рекомбинации создайте выходной массив out с формой (5,4,6). 6 - это количество окон в win, а (5,4) - arr.shape. Мы будем заполнять этот массив одним окном в каждом срезе вдоль оси -1.

# the array to be filled
out = np.zeros((5,4,6)) # shape of original arr stacked to the number of windows 

# now make the set of indices of the window corners in arr 
inds = np.indices((3,2)).T.reshape(3*2,2)

# and generate a list of slices. each selects the position of one window in out 
slices = [np.s_[i[0]:i[0]+3:1,i[1]:i[1]+3:1,j] for i,j in zip(inds,range(6))] 

# this will be the slow part. You have to loop through the slices. 
# does anyone know a vectorized way to do this? 
for (ii,jj),slc in zip(inds,slices):
    out[slices] = win[ii,jj,:,:]

Теперь массив out содержит все окна в правильных положениях, но разделен на панели по оси -1. Чтобы извлечь исходный массив, вы можете усреднить все элементы по этой оси, которые не содержат нулей.

>>> out = np.true_divide(out.sum(-1),(out!=0).sum(-1))
>>> # this can't handle scenario where all elements in an out[i,i,:] are 0
>>> # so set nan to zero 

>>> out = np.nan_to_num(out)
>>> out 
array([[ 0.,  1.,  2.,  3.],
       [ 4.,  5.,  6.,  7.],
       [ 8.,  9., 10., 11.],
       [12., 13., 14., 15.],
       [16., 17., 18., 19.]])

Можете ли вы придумать способ векторизовать массив фрагментов?

Все вместе:

def from_windows(win):
    """takes in an arrays of windows win and returns the original array from which they come"""
    a0,b0,w,w = win.shape # shape of window
    a,b = a0+w-1,b0+w-1 # a,b are shape of original image 
    n = a*b # number of windows 
    out = np.zeros((a,b,n)) # empty output to be summed over last axis 
    inds = np.indices((a0,b0)).T.reshape(a0*b0,2) # indices of window corners into out 
    slices = [np.s_[i[0]:i[0]+3:1,i[1]:i[1]+3:1,j] for i,j in zip(inds,range(n))] # make em slices 
    for (ii,jj),slc in zip(inds,slices): # do the replacement into out 
        out[slc] = win[ii,jj,:,:]
    out = np.true_divide(out.sum(-1),(out!=0).sum(-1)) # average over all nonzeros 
    out = np.nan_to_num(out) # replace any nans remnant from np.alltrue(out[i,i,:]==0) scenario
    return out # hope you've got ram 

и тест:

>>> arr = np.arange(32**2).reshape(32,32)
>>> win = viewW(arr, (3,3))
>>> np.alltrue(arr==from_windows(win))
True
>>> %timeit from_windows(win)
6.3 ms ± 117 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

На практике это не будет достаточно быстрым, чтобы вы могли тренироваться на

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...