DOCX в HTML с проблемой phpword - PullRequest
0 голосов
/ 23 мая 2018

Я сталкиваюсь с проблемой при преобразовании документа docx в HTML с помощью библиотеки PHPWord (https://github.com/PHPOffice/PHPWord).

Вот фрагмент кода, который я использую:

$phpWord = \PhpOffice\PhpWord\IOFactory::load('test.docx');
$htmlWriter = new \PhpOffice\PhpWord\Writer\HTML($phpWord);
$htmlWriter->save('test.html');

Проблема заключается в том, что каждыйблок текста инкапсулируется в теги <p> независимо от того, были ли определены заголовки в документе docx. Я ожидаю, что будут сгенерированы теги <h1> <h2> ... Список маркеров также потерян.

Работает ли он какразработан или я что-то пропустил?

Спасибо за ваш отзыв.

С уважением

1 Ответ

0 голосов
/ 25 мая 2018

Существует небольшая проблема, когда дело доходит до использования IOFactory :: load PHPWord, например, то, с чем вы столкнулись сейчас, в зависимости от того, что сохранило файл или какая версия MicrosoftWord используется для создания этого файла.Если кодировка и теги файла docx не могут быть найдены PHPWord, то это приведет к неожиданным результатам

Код в порядке, проблема уже связана с зависимостью.

...