JODConverter & LibreOffice: конвертируйте документ в html со встроенными изображениями - PullRequest
1 голос
/ 02 апреля 2019

Я конвертирую doc / docx файлы в html с помощью библиотеки JODConverter (4.2.2) и LibreOffice (6.2). Мне нужно сохранить изображения как встроенные в html-файл, но по умолчанию они сохраняются в отдельных файлах.

Чтобы сделать это с помощью интерфейса командной строки LibreOffice, я использую:

soffice --convert-to html:HTML:EmbedImages example.docx

Мне интересно, есть ли способ передать параметр EmbedImages через библиотеку JODConverter?

Мой код Java:

LocalConverter
    .make()
    .convert(new FileInputStream(docFile))
    .as(DefaultDocumentFormatRegistry.getFormatByMediaType(file.getMediaType().getName()))
    .to(htmlTempFile)
    .as(DefaultDocumentFormatRegistry.HTML)
    .execute();

1 Ответ

0 голосов
/ 25 апреля 2019

Это будет работать:

final DocumentFormat format =
    DocumentFormat.builder()
        .from(DefaultDocumentFormatRegistry.HTML)
        .storeProperty(DocumentFamily.TEXT, "FilterOptions", "EmbedImages")
        .build();

LocalConverter
    .make()
    .convert(new FileInputStream(docFile))
    .as(DefaultDocumentFormatRegistry.getFormatByMediaType(file.getMediaType().getName()))
    .to(htmlTempFile)
    .as(format)
    .execute();
...