Я пытался использовать этот код
from PIL import Image
from pytesseract import image_to_string
import cv2
img = cv2.imread('/media/linux/DATADISK/clanek-phoebe/vypis_obr/2.jpg', cv2.IMREAD_UNCHANGED)
print('Original Dimensions : ',img.shape)
scale_percent = 2000 # percent of original size
width = int(img.shape[1] * scale_percent / 100)
height = int(img.shape[0] * scale_percent / 100)
dim = (width, height)
resized = cv2.resize(img, dim, interpolation = cv2.INTER_AREA)
print('Resized Dimensions : ',resized.shape)
cv2.imwrite("new.jpg",img)
im = cv2.imread('/media/linux/DATADISK/clanek-phoebe/vypis_obr/new.jpg', cv2.IMREAD_UNCHANGED)
with open('obrtext.txt', mode='w', encoding='utf-8') as a_file:
a_file.write(image_to_string(im))
для преобразования изображения в txt:
Вывод был:
2.832034
2.408290
24.984529
9.561579
14.477622
4.014763
“8.221435,
“3.548312
3.514344
4211277
2.482226
1.160587
поэтому есть "вместо минуса и отсутствует одна десятичная точка. По этой причине я попытался увеличить изображение в коде, но это не помогло.
Я получилсовет, чтобы я преобразовал рисунок в оттенки серого и создал матрицу в соответствии с rgb, где каждый пиксель имеет значение от 0 до 255. Затем выполните бинаризацию, чтобы иметь 0 и 1. Для всех пикселей. Не могли бы вы помочь мне, как написать это. Илиу тебя есть другое предложение?