Ошибка разбора XML при попытке открыть Word - PullRequest
0 голосов
/ 17 мая 2018

только что закончил свою работу, сохранил и открыл (для контроля) docx - файл MS Word, и он не может открыться из-за проблемы с содержимым. Он говорит «Ошибка синтаксического анализа XML» и его местоположение (строка 2, столбец 2435). Как я могу это исправить или хотя бы получить текст из формата xml? Большое спасибо.

Ответы [ 2 ]

0 голосов
/ 18 мая 2018

Себастьян прав, у вас есть некоторые проблемы с тегами XML в предоставленном вами документе, возможно, из-за ошибок копирования / вставки.

Мои шаги действия:

  • разархивированный файл Word
  • отредактированный document.xml с редактором XML
  • Удалены ошибки структуры XML

(в основном то, что описано здесь: Как изучить содержимое файла .docx )

Ссылка для скачивания на восстановленный документ .docx:

document_restored

(загрузка файла действительна в течение 7 дней)

Надеюсь, это поможет. Ура!

0 голосов
/ 17 мая 2018

Ваш текущий XML недействителен.

Пример правильного XML:

<Elem1>
    <Elem2>
        <Elem3/>
    </Elem2>
</Elem1>

Ваш XML выглядит так:

<Elem1>
    <Elem3>
        <Elem2>
    </Elem3>
    </Elem2>
</Elem1>

Проблема с вашим XML заключается в следующем: Вы открываете txbxContent непосредственно перед закрытием sdtContent, что является неверной разметкой. Кроме того, txbxContent закрывается намного позже, чем sdtContent. Вы можете попытаться устранить ошибки, удалив теги txbxContent и txbx или правильно их закрыв.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...