JSoup Document проблема структуры - PullRequest
0 голосов
/ 28 февраля 2012

Попробуйте следующее ....

String rq = "http://www.musicbrainz.org/ws/2/release/ac1afa8d-1a86-4435-9714-0a5e808e4c83?inc=recordings";<br></br>
Document doc = Jsoup.connect(rq).get();

В браузере видно, что треки структурированы следующим образом ...

<track><br></br>
    <position>1</position><br></br>
    <length>249000</length><br></br>
    <recording><br></br>
    <title>Hello</title><br></br>
    <length>249000</length><br></br>
    </recording><br></br>
 </track&gt;<br></br>

Но если вы посмотрите в Документ, он был реорганизован в ...

<track></track><br></br>
<position>1</position><br></br>
<length>249000</length><br></br>
<recording><br></br>
   <title>Hello</title><br></br>
   <length>249000</length><br></br>
</recording><br></br>

Есть идеи, что происходит? (используя jsoup-1.6.1.jar)
Спасибо!

Ответы [ 2 ]

1 голос
/ 28 февраля 2012

Я полагаю, это потому, что анализируемый вами документ - это XML, а не HTML. Jsoup - это в первую очередь HTML-парсер.

0 голосов
/ 17 марта 2013

Вы можете использовать jsoup для разбора XML следующим образом:

Document doc = Jsoup.parse(xmlString, baseInput, Parser.xmlParser());
...