Как избежать специального символа в разборе SAX - PullRequest
0 голосов
/ 08 ноября 2011

Я анализирую XML-файл ниже:

    <description>
    <p>
    <a href="http://news.yahoo.com/jessica-chastain-talks-princess-diana-biopic-  164102608.html">
    <img src="http://l3.yimg.com/bt/api/res/1.2/zD3Iwxezk8JVGQwhow7y4Q--/YXBwaWQ9eW5ld3M7Zmk9ZmlsbDtoPTg2O3E9ODU7dz0xMzA-/http://media.zenfs.com/en_us/News/Reuters/2011-11-07T171906Z_01_BTRE7A61C3Y00_RTROPTP_2_FILM-US-JESSICACHASTAIN.JPG" 
         alt="photo" 
         align="left" 
         title="Actress Chastain poses for photographers as she arrives on the "Wilde Salome" red carpet at the 68th Venice Film Festival" border="0" />
    </a>NEW YORK (TheWrap.com) - Jessica Chastain may not win Oscar gold this year, but it appears she will wear a crown.
    </p>
    <br clear="all"/>
    </description>

Я использую парсер SAX и пытаюсь получить данные внутри тега img , атрибут title. Но из-за специального символа "Wild Salome" в тексте я получаю исключение ExpatParser. Не могли бы вы дать мне знать, как это можно решить?

1 Ответ

1 голос
/ 08 ноября 2011

XML неверен.Значение атрибута не должно содержать кавычек (").Программа, которая его сгенерировала, должна заменить внутренние символы " на &quot;.

Если вы напечатаете &quot; на веб-странице, браузер автоматически покажет на ее месте символ ".

...