Обнаружение размытости изображения RGB - PullRequest
2 голосов
/ 26 мая 2020

Я хочу обнаружить размытость изображения. Для этого я конвертирую изображение RGB в шкалу серого, сворачиваю его с ядром Лапласа и вычисляю дисперсию. Если дисперсия высока, то изображение сфокусировано и размыто. Я приложил ss фрагмента кода ниже. Но я получаю сообщение об ошибке. Пожалуйста, помогите мне с этим кодом. Ниже приведена функция, которая сворачивает изображение и вычисляет дисперсию:

def is_blur(image) :
   """
   This function convolves a grayscale image with
   laplacian kernel and calculates its variance.
   """
   #Laplacian kernel
   laplacian_kernel = np.array([[0,1,0],[1,-4,1],[0,1,0]])
   laplacian_kernel = tf.expand_dims(laplacian_kernel, 0)
   laplacian_kernel = tf.expand_dims(laplacian_kernel, 0)
   laplacian_kernel = tf.cast(laplacian_kernel, tf.float32)
   #Convolving image with laplacian kernel
   new_img = tf.nn.conv2d(image, laplacian_kernel, stride=[1, 1, 1, 1], padding="SAME")
   #Calculating variance
   img_var = tf.math.reduce_variance(new_img)
   return img_var

Ниже приведен код для загрузки изображений и вызова вышеуказанной функции:

from tqdm import tqdm
path = "/content/Data/Train/{0}/"
N_CLASSES = 43
blurness_list = []
for itr in tqdm(range(N_CLASSES)) :
   files = os.listdir(path.format(itr))
   for img in files :
      image_string = tf.io.read_file(path.format(itr) + img)
      #decoding image
      image = tf.image.decode_png(image_string, channels=3)
      #Converting image to grayscale
      image = tf.image.rgb_to_grayscale(image)
      # This will convert to float values in [0, 1]
      image = tf.image.convert_image_dtype(image, tf.float32)
      #Reshaping image since conv2d accepts a 4-d tensor.
      image = tf.reshape(image, shape=[1, image.shape[0], image.shape[1], 1])
      blurness_list.append(is_blur(image))

Ниже приведена ошибка, которую я получение:

InvalidArgumentError: глубина ввода должна делиться на глубину фильтра: 1 vs 3 [Op: Conv2D]

Пожалуйста, помогите мне с этим кодом.

1 Ответ

1 голос
/ 26 мая 2020

Это должно быть легко исправить: вы создаете свой фильтр 2d 3x3, а затем вставляете размеры размера 1 в начало через tf.expand_dims, предположительно, чтобы сделать фильтр 4d, как требуется conv2d. Однако для conv2d фильтры должны быть width x height x in_channels x out_channels, т. Е. Размер фильтра должен быть в конце . Это должно исправить это:

laplacian_kernel = np.array([[0,1,0],[1,-4,1],[0,1,0]])
laplacian_kernel = tf.expand_dims(laplacian_kernel, -1)
laplacian_kernel = tf.expand_dims(laplacian_kernel, -1)
laplacian_kernel = tf.cast(laplacian_kernel, tf.float32)

В качестве альтернативы обратите внимание, что вы также можете сделать что-то вроде этого:

laplacian_kernel = laplacian_kernel[..., None, None]

где None используется для вставки осей.

...