Как сделать текст в фото-списке более понятным? - PullRequest
0 голосов
/ 05 мая 2020

У меня около сотни не очень резких фотографий, и я хотел бы сделать их резче.

introducir la descripción de la imagen aquí

Итак, я создал сценарий с python, который уже пытается с ним. Я пытался с помощью программ для чтения PIL, OpenCV и OCR читать тексты из изображений.

# External libraries used for
# Image IO
from PIL import Image

# Morphological filtering
from skimage.morphology import opening
from skimage.morphology import disk

# Data handling
import numpy as np

# Connected component filtering
import cv2

black = 0
white = 255
threshold = 160

# Open input image in grayscale mode and get its pixels.
img = Image.open("image3.png").convert("LA")
pixels = np.array(img)[:,:,0]

# Remove pixels above threshold
pixels[pixels > threshold] = white
pixels[pixels < threshold] = black


# Morphological opening
blobSize = 1 # Select the maximum radius of the blobs you would like to remove
structureElement = disk(blobSize)  # you can define different shapes, here we take a disk shape
# We need to invert the image such that black is background and white foreground to perform the opening
pixels = np.invert(opening(np.invert(pixels), structureElement))


# Create and save new image.
newImg = Image.fromarray(pixels).convert('RGB')
newImg.save("newImage1.PNG")

# Find the connected components (black objects in your image)
# Because the function searches for white connected components on a black background, we need to invert the image
nb_components, output, stats, centroids = cv2.connectedComponentsWithStats(np.invert(pixels), connectivity=8)

# For every connected component in your image, you can obtain the number of pixels from the stats variable in the last
# column. We remove the first entry from sizes, because this is the entry of the background connected component
sizes = stats[1:,-1]
nb_components -= 1

# Define the minimum size (number of pixels) a component should consist of
minimum_size = 100

# Create a new image
newPixels = np.ones(pixels.shape)*255

# Iterate over all components in the image, only keep the components larger than minimum size
for i in range(1, nb_components):
    if sizes[i] > minimum_size:
        newPixels[output == i+1] = 0

# Create and save new image.
newImg = Image.fromarray(newPixels).convert('RGB')
newImg.save("newImage2.PNG")

Но он возвращает:

introducir la descripción de la imagen aquí introducir la descripción de la imagen aquí

Я бы предпочел, чтобы он не был черно-белым, лучшим результатом будет тот, который увеличивает масштаб как текста, так и изображения

1 Ответ

0 голосов
/ 05 мая 2020

Как уже говорилось в комментариях, качество очень плохое. Это непростая проблема. Однако есть несколько уловок, которые вы можете попробовать.

Похоже, это связано с некоторым сглаживанием, примененным к изображению / сканированию. Я бы попробовал реверсировать сглаживание , если возможно. Как описано в посте, шаги будут похожи на это:

  1. Применить фильтр нижних частот
  2. разница = original_image - low_pass_image
  3. sharpened_image = original_image + alpha * разница

Код может выглядеть примерно так:

from skimage.filters import gaussian

alpha = 1   # Sharpening factor

low_pass_image = gaussian(image, sigma=1)
difference = original_image - low_pass_image
sharpened_image = original_image + alpha*difference

Кроме того, изображение scikit имеет реализацию маски нерезкости , а также wiener фильтр .

...