Скачать WMF из pptx и декодировать в JPEG - PullRequest
0 голосов
/ 15 октября 2019

Здравствуйте, пользователи stackoverflow.

Я пытаюсь загрузить изображение из презентации Powerpoint и затем обработать его (для распознавания чисел на нем в определенных координатах).

Моя проблема заключается в том, чтоЯ могу загрузить изображение из данных pptx только в формате .wmf и не могу конвертировать его. Я уже испробовал все возможные решения.

from pptx import Presentation
from pptx.enum.shapes import MSO_SHAPE_TYPE

pptx_path = "name_pptx.pptx"

prs = Presentation(pptx_path)

desired_slide = prs.slides[6 - 1]

for shape in desired_slide.shapes:
    if shape.shape_type == MSO_SHAPE_TYPE.PICTURE:
        image_file_bytes = shape.image.blob
        file_extension = shape.image.ext # at this point format is .wfm

Интересно, что в Powerpoint я могу выбрать желаемое расширение .jpeg при сохранении файла.

1 Ответ

0 голосов
/ 15 октября 2019

Мне потребовалось несколько часов, чтобы решить мою проблему, преобразование wmf-файла в jpg немного сложнее в Windows. Я добавляю изображение во временный файл Excel, а затем загружаю из него изображение.

class ExcelHelpers():
    @staticmethod
    def add_img_to_excel(path_to_wmf):
        import xlsxwriter

        workbook = xlsxwriter.Workbook('test.xlsx')
        worksheet = workbook.add_worksheet()

    worksheet.insert_image('A1', path_to_wmf)

    workbook.close()

    @staticmethod
    def get_img_from_excel(long_filename):
        filename = os.path.basename(long_filename).split('.')[0]
        from PIL import ImageGrab
        import win32com.client as win32

        excel = win32.gencache.EnsureDispatch('Excel.Application')
        path_to_excel = os.path.join(os.getcwd(), 'test.xlsx')

        workbook = excel.Workbooks.Open(path_to_excel)

        for sheet in workbook.Worksheets:
            for i, shape in enumerate(sheet.Shapes):
                if shape.Name.startswith('Picture'):
                    shape.Copy()
                    image = ImageGrab.grabclipboard()
                    image.save('{}.jpg'.format(filename), 'jpeg')

        workbook.Close()
        excel.Quit()
        del excel
        os.remove(long_filename)
        os.remove('test.xlsx')
...