Исправить поврежденные теги в xhtml - PullRequest
0 голосов
/ 15 сентября 2018

Я создаю приложение CMS, которое представляет контент HTML5 (сценарии театральной игры), используя бритву, taghelpers и CSS. Театральные пьесы были доставлены мне в (искаженном) формате xhtml, и я испробовал множество решений regex и HTML-Tiny для исправления искаженных тегов. Проблема в том, что пользовательский открывающий тег закрывается

вместо соответствующего закрывающего тега. Пример содержимого:
... header stuff omitted
<article>
    <section>
        <actor1>Hi Bob. My first speaking line is enclosed in properly formed tag.</actor1>
        <actor2>Hi Ted. That's great but my first speaking line is malformed and needs repair.</p>
        <actor1>Yeah, I have several malfomed lines too.</p>
        <actor3>It sucks 'cause the developer has built a great app to present our play as HTML5 content.</p>
        <actor3>Much of the actors speaking lines are taged with the wrong closing tag and requires repair of hundreds of these files.</p>
        <actor2>and some custom tags are properly formed.</actor2>
    </section>
</article>

Восстановление этих пользовательских тегов оказалось сложнее, чем кажется на первый взгляд. Visual Studio дразнит меня ошибкой: обнаружен неверный помощник тега 'actor1'. Помощники тегов должны иметь начальный и конечный тег или быть самозакрывающимися. поэтому VS определяет проблему, но не может ее исправить.

Я попробовал это https://github.com/gabrieleteotino/TidyHtml5Managed и подошел близко, но это испортило вложение. Какой самый простой способ очистить теги в файлах содержимого? Может ли VS сделать это автоматически? Я могу написать консольное приложение ...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...