Парсер DOM для не xml - PullRequest
       18

Парсер DOM для не xml

0 голосов
/ 30 августа 2009

Я хочу проанализировать следующий тип текста. Example1 <root>my name is <j> <b> mike</b> </j> </root>

пример 2

<root> my name is   <mytag1 attribute="val" >mike</mytag1> and yours is <mytag2> john</mytag2> </root>

Могу ли я проанализировать его с помощью анализатора DOM? У меня не будет одинакового формата каждый раз. У меня могут быть разные форматы, в которые вложены теги. Я не знаю формат заранее.

Ответы [ 2 ]

1 голос
/ 30 августа 2009

Оба этих примера являются действительными документами XML, поэтому нет никаких причин, по которым вы можете это сделать.

Если ваш XML очень прост, особенно если он объединяет текст и теги вместе, вы можете сначала запустить его с помощью XSL-преобразования , чтобы облегчить анализ формата или преобразовать его в другой формат, такой как HTML.

0 голосов
/ 30 августа 2009

Вы можете использовать анализатор DOM для приведенных вами примеров - это допустимый XML. Однако вы не сможете использовать его для не-XML в соответствии с вашей темой.

Когда вы говорите, что можете иметь «разные форматы, в которые вложены теги», что именно вы имеете в виду? Если это всегда простая вложенность, например

<root>
  <tag1>
    <tag2>
      <tag3>
        Stuff
      </tag3>
    </tag2>
  </tag1>
</root>

Тогда это будет хорошо. Однако синтаксическому анализатору XML не понравится разметка, в которой «внешний» тег закрывается перед «внутренним»:

<root>
  <tag1>
    <tag2>
      Stuff
    </tag1> <!-- Invalid -->
  </tag2>
</root>
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...