Я использую скрипт из github для обрезки изображений, оставляя только текстовые блоки.Я пытаюсь сохранить мои изображения в виде файлов TIFF для максимально возможного качества, потому что я буду делать OCR.
Теперь у меня проблема в том, что она работает только с jpg -> png, если я изменю значения наTIFF в конце строки, я получаю сообщение об ошибке, подобное этому
newOCR10.tiff image has wrong mode
Любые идеи о том, как я могу решить эту проблему?
Вот код, который я изменяю:
if __name__ == '__main__':
if len(sys.argv) == 2 and '*' in sys.argv[1]:
files = glob.glob(sys.argv[1])
random.shuffle(files)
else:
files = sys.argv[1:]
for path in files:
out_path = path.replace('.jpg', '.crop.png') //'.tiff' '.crop.tiff'
if os.path.exists(out_path): continue
try:
process_image(path, out_path)
except Exception as e:
print '%s %s' % (path, e)
tiffinfo newOCR6.tiff возвращает мне эту информацию:
TIFF Directory at offset 0xca90b8 (13275320)
Image Width: 2316 Image Length: 2866
Resolution: 300, 300 (unitless)
Bits/Sample: 16
Compression Scheme: None
Photometric Interpretation: min-is-black
FillOrder: msb-to-lsb
Orientation: row 0 top, col 0 lhs
Samples/Pixel: 1
Rows/Strip: 1
Planar Configuration: single image plane
Page Number: 0-1
White Point: 0.3127-0.329
PrimaryChromaticities: 0.640000,0.330000,0.300000,0.600000,0.150000,0.060000