Я анализирую XML-файл ниже:
<description> <p> <a href="http://news.yahoo.com/jessica-chastain-talks-princess-diana-biopic- 164102608.html"> <img src="http://l3.yimg.com/bt/api/res/1.2/zD3Iwxezk8JVGQwhow7y4Q--/YXBwaWQ9eW5ld3M7Zmk9ZmlsbDtoPTg2O3E9ODU7dz0xMzA-/http://media.zenfs.com/en_us/News/Reuters/2011-11-07T171906Z_01_BTRE7A61C3Y00_RTROPTP_2_FILM-US-JESSICACHASTAIN.JPG" alt="photo" align="left" title="Actress Chastain poses for photographers as she arrives on the "Wilde Salome" red carpet at the 68th Venice Film Festival" border="0" /> </a>NEW YORK (TheWrap.com) - Jessica Chastain may not win Oscar gold this year, but it appears she will wear a crown. </p> <br clear="all"/> </description>
Я использую парсер SAX и пытаюсь получить данные внутри тега img , атрибут title. Но из-за специального символа "Wild Salome" в тексте я получаю исключение ExpatParser. Не могли бы вы дать мне знать, как это можно решить?
XML неверен.Значение атрибута не должно содержать кавычек (").Программа, которая его сгенерировала, должна заменить внутренние символы " на ".
"
"
Если вы напечатаете " на веб-странице, браузер автоматически покажет на ее месте символ ".