Как создать пользовательский слой Keras, используя функции, не включенные в бэкэнд, для выполнения выборки тензорных данных?
/ 27 февраля 2019

Я пытаюсь создать пользовательский слой в keras.Этот слой должен выполнить выборку по входному тензору (в соответствии с распределением вероятностей) и вывести тензор того же размера, только с выбранными значениями, остальные равны нулю.Однако в keras.backend, насколько мне известно, функции выборки недоступны.Обратите внимание, что этот слой не имеет обучаемых параметров, я просто хочу функцию, которая изменяет предыдущий вывод.

Сейчас я пытаюсь преобразовать входной тензор из Tensor объекта в numpy.ndarray, используя keras.backend.eval().Согласно вопросу stackoverflow # 47577060 , это кажется невозможным.Хотя было бы неплохо применить обычную функцию numpy для выборки np.random.choice.Эта функция принимает только 1-мерный массив np.array, как для ввода, так и для распределения вероятностей (нельзя использовать тензоры).Обратите внимание, что распределение вероятностей, которое я упоминаю, на самом деле является самим входным сигналом (моя цель - выборка элементов с высоким значением с более высокой вероятностью)

Пользовательский слой для выборки называется MyLayerи определяется как

def MyLayer(input_tensor): #Here we sample from the tensor directly!

# Convert to numpy array: in keras the input_tensor has shape [None,H,W,D] and is Keras.Tensor object...  
input_tensor = keras.backend.eval(input_tensor) # convert to np.array  #** THIS IS WHERE IT FAILS **#
input_tensor = input_tensor[0,:,:,:] # first dimension is None so we discard

# need to transform the np.array tensor into a matrix (custom function)
input_matrix = tensor_to_matrix(input_tensor)

# create the probability distribution that the sampling will follow
# the probability must be the matrix itself (to sample the highest elements in priority)
probability_matrix = input_matrix/np.max(input_matrix) # must be normalized to sum to 1
prob_vec = probability_matrix.flatten('F') # vectorize it, column-first

# create list of same size where each element is the value and its own position (i,j). it is necessary to create a string "value/i/j" for each element (i have no other idea)
matrix_value_position = []
for j in range(input_matrix.shape[1]):
    for i in range(input_matrix.shape[0]):
        t = str(input_matrix[i,j])+'/'+str(i)+'/'+str(j) #it will be parsed later to recover value,i,j
vec_value_position = np.array(matrix_value_position)

# Sample points according to a probability distribution
num_samples = 10000
sample = np.random.choice(vec_value_position, num_samples, p=prob_vec) #**THIS IS WHERE IT SAMPLES**#

# parse the strings that have been sampled, store them in a numpy array
samples_results = []
for i in range(len(sample)):
samples_results = np.array(samples_results) 

# reconstruct the matrix from the samples (the rest is zero)
reconstructed_matrix = np.zeros((input_matrix.shape[0],input_matrix.shape[1]))
for s in samples_results:
    i = int(s[1])
    j = int(s[2])
    reconstructed_matrix[x,y] = float(s[0]) #retrieve the value sampled at position [i,j]

# return a np.array tensor (custom function)
output_tensor_numpy = reverse_tensor_expand(reconstructed_matrix, input_tensor.shape)

# convert back to Keras Tensor object 
output_tensor_keras = keras.backend.variable(value=output_tensor_numpy, dtype='float32')

return output_tensor_keras

Затем я применяю слой со следующим (это второй слой):

model = keras.Sequential() 
model.add(Conv2D(filters=6, kernel_size=(7, 7), activation='relu', input_shape=(28,28,1))) 
model.add(Lambda(MyLayer, output_shape=MyLayerOutputShape)) #note: output_shape is equal to input_shape. MyLayerOutputShape is the identity

Если у кого-то есть идея решить эту проблему или определить другой способ выполнения этого слоя выборки и быть совместимым с Keras, я был бы очень признателен за это

