Конвертировать текстовый файл в TIFF в Python - PullRequest
1 голос
/ 23 октября 2019

Я преобразую текстовый файл в формат TIFF, используя следующий код, но он не работает, когда содержимое текстового файла начинается со специальных символов. Я не знаю, почему это не работает. Не могли бы вы помочь мне выполнить эту задачу

def main():
    image = text_image('/Users/administrator/Desktop/367062657_1.text')
    image.show()
    image.save('contentok.tiff')

def text_image(text_path, font_path=None):

    grayscale = 'L'
    # parse the file into lines
    with open(text_path) as text_file:
        lines = tuple(l.rstrip() for l in text_file.readlines())

    large_font = 20
    font_path = font_path or 'cour.ttf'  
    try:
        font = PIL.ImageFont.truetype(font_path, size=large_font)
    except IOError:
        font = PIL.ImageFont.load_default()
        print('Could not use chosen font. Using default.')
    pt2px = lambda pt: int(round(pt * 96.0 / 72))
    max_width_line = max(lines, key=lambda s: font.getsize(s)[0])
    test_string = 'ABCDEFGHIJKLMNOPQRSTUVWXYZ'
    max_height = pt2px(font.getsize(test_string)[1])
    max_width = pt2px(font.getsize(max_width_line)[0])
    height = max_height * len(lines) # perfect or a little oversized
    width = int(round(max_width + 5))  # a little oversized

    image = PIL.Image.new(grayscale, (width, height), color=PIXEL_OFF)
    draw = PIL.ImageDraw.Draw(image)
    vertical_position = 5
    horizontal_position = 5
    line_spacing = int(round(max_height * 1.0))
    for line in lines:
        draw.text((horizontal_position, vertical_position),
                  line, fill=PIXEL_ON, font=font)

        vertical_position += line_spacing
    c_box = PIL.ImageOps.invert(image).getbbox()
    image = image.crop(c_box)`enter code here`
    return image

Ошибка:

Ошибка: UnicodeDecodeError: кодек «utf-8» не может декодировать байт 0xf2 в позиции 18:недопустимый байт продолжения

1 Ответ

0 голосов
/ 23 октября 2019

Ваша проблема здесь:

with open(text_path) as text_file:
    lines = tuple(l.rstrip() for l in text_file.readlines())

Вы загружаете текстовый файл как текст (по умолчанию UTF-8), когда данные в нем несовместимы с UTF-8, согласноошибка, которую вы упомянули в ваших комментариях.

Вам следует открыть файл с указанной кодировкой, соответствующей данным. См. документы здесь

В принципе что-то вроде этого должно работать:

with open(text_path, encoding='windows-1255') as text_file:
    lines = tuple(l.rstrip() for l in text_file.readlines())

Но, конечно, windows-1255 это всего лишь предположение от меня ... вы должны знатькак ваши файлы кодируются, и посмотрите здесь список доступных значений

...