проблема с использованием SAX XML Parser - PullRequest
1 голос
/ 04 сентября 2011

Я использую SAX Parser для синтаксического анализа XML.Проблема для следующего XML-кода:

<description>
Designer:Paul Smith Color:Plain Black Fabric/Composition:100% cotton        Weave/Pattern:pinpoint Sleeve:Long-sleeved Fit:Classic Front style:Placket front Back style:Side pleat back Collar:Classic/straight collar Button:Pearlescent front button Pocket:rounded chest pocket Hem:Rounded hem
</description>

Я получаю это:

Designer:Paul Smith
Color:Plain Black 

Остальные части отсутствуют.То же самое происходит с несколькими другими строками.Может кто-нибудь любезно сказать мне, в чем проблема с моим подходом?

Мой код приведен ниже:

Код парсера:

try {
        /** Handling XML */
        SAXParserFactory spf = SAXParserFactory.newInstance();
        SAXParser sp = spf.newSAXParser();
        XMLReader xr = sp.getXMLReader();

        /** Send URL to parse XML Tags */
        URL sourceUrl = new URL(
        "http://50.19.125.224/Demo/VeryGoodSex_and_the_City_S6E6.xml");

        /** Create handler to handle XML Tags ( extends DefaultHandler ) */
        MyXMLHandler myXMLHandler = new MyXMLHandler();
        xr.setContentHandler((ContentHandler) myXMLHandler);
        xr.parse(new InputSource(sourceUrl.openStream()));

    } catch (Exception e) {
        System.out.println("XML Pasing Excpetion = " + e);
    }

Объект для хранения проанализированного XML Информация:

public class ParserObject {

String name=null;
String description=null;
String bitly=null; //single
String productLink=null;//single
String productPrice=null;//single
Vector<String> price=new Vector<String>();
}

Класс обработчика:

public void endElement(String uri, String localName, String qName)
throws SAXException {


    currentElement = false;


    if (qName.equalsIgnoreCase("title"))
    {
        xmlDataObject[index].name=currentValue;
    }

    else if (qName.equalsIgnoreCase("artist"))
    {
        xmlDataObject[index].artist=currentValue;
    } 

}


public void startElement(String uri, String localName, String qName,
Attributes attributes) throws SAXException {


    currentElement = true;

    if (qName.equalsIgnoreCase("allinfo"))
    {
        System.out.println("started");
    }

    else if (qName.equalsIgnoreCase("tags"))
    {
        insideTag=1;
    } 

}

public void characters(char[] ch, int start, int length)
throws SAXException {

    if (currentElement) {
        currentValue = new String(ch, start, length);
        currentElement = false;
    }

}

Ответы [ 2 ]

2 голосов
/ 04 сентября 2011

Вы должны объединять символы, которые вам дает парсер, пока он не вызовет endElement.

Попробуйте удалить currentElement = false; из обработчика characters и

currentValue = currentValue + new String(ch, start, length);

Инициализируйте currentValue пустой строкой или дескриптором null значением в приведенном выше выражении.

1 голос
/ 04 сентября 2011

Я думаю, что персонажи читают некоторые, но не все персонажи одновременно.Таким образом, вы получите только первый «кусок».Попробуйте напечатать каждый символьный блок в отдельной строке, как отладку (до if).

...