Сохранение документа Word в формате HTML в кодировке UTF-8 - PullRequest
2 голосов
/ 07 мая 2019

У меня есть Perl-скрипт, который сохраняет документ Word в формате HTML. Работает следующий код:

use strict;
use Win32::OLE::Const 'Microsoft Word';
[...]
$go_word_doc->SaveAs2({
    FileName => $gs_html_name,
    FileFormat => wdFormatFilteredHTML
    });

Чтобы закодировать выходной файл в UTF-8, я написал это:

use strict;
use Win32::OLE::Const 'Microsoft Word';
use Win32::OLE::Const 'Microsoft Office [0-9.]+ Object Library';
[...]
$go_word_doc->SaveAs2({
    FileName => $gs_html_name,
    FileFormat => wdFormatFilteredHTML,
    Encoding => msoEncodingUTF8
    });

Код выполняется, но сгенерированный файл неправильно закодирован.

Тогда я задаюсь вопросом, как поступить. Я читал об использовании WebOptions, но не могу найти способ их устранения.

Может ли кто-нибудь помочь, пожалуйста? Заранее спасибо.

...