Как исправить ошибку разбора Windows-1256 XML в Android? - PullRequest
1 голос
/ 29 ноября 2011

У меня ошибка при разборе XML-документа с помощью синтаксического анализатора саксофона в Android. Может кто-нибудь помочь мне исправить эту ошибку? Ошибка выглядит так:

org.apache.harmony.xml.ExpatParser$ParseException: At line 5, column 9: not well-formed (invalid token)

Кодировка документа xml - windows-1256. Вот пример из XML-кода:

<?xml version="1.0" encoding="windows-1256"?>
<rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/">
    <channel>
        <title>منتديات عالم المرأة</title>
        <link>http://forum.mn66.com/</link>
        <description>مكياج,فساتين سهرة,ازياء,ملابس,العناية,بالبشرة,بالشعر,بالجسم,وظائف,تسريحات,fashion</description>
        <language>ar</language>
        <lastBuildDate>Wed, 23 Nov 2011 08:38:36 GMT</lastBuildDate>
        <generator>vBulletin</generator>
        <ttl>60</ttl>
        <image>
            <url>http://forum.mn66.com/images/Ops_fayez/misc/rss.jpg</url>
            <title>منتديات عالم المرأة</title>
            <link>http://forum.mn66.com/</link>
        </image>
        <item>
            <title>ودها تتعلم تسوق</title>
            <link>http://forum.mn66.com/t312645.html</link>
            <pubDate>Wed, 23 Nov 2011 08:31:20 GMT</pubDate>
            <description><![CDATA[‏&#8203;‏&#8203;قالت لـ زوجھا : [ علمني قيادھ السيارھ &#58974; ] !&#8233;فقال لہـا : انتـي گالملگھ . .  &#8233;والملكھ لا تقود يا حبيبتـي&#8233;فقالت لھ : حسنــاً ..&#8233;لن &#1649;قود .. لن أغسـل .. لن أطبـخ !&#8233;لن أربـي الأطفـال !&#8233;لأننـي ” ملگھ “ والملگھ لا تقوم بہذھ المہام &#8233;اضافھ الى اني احتـاج عشرات الخادمـات&#8233;حتى اتفرغ للاهتمام بـ جمالي ;;)...]]></description>
            <content:encoded><![CDATA[<div><div style="margin:auto;text-align:center;"></div><br /><div style="margin:auto;text-align:center;">ودها تتعلم تسوق<br /><br /></div><!-- google_ad_section_start -->‏&#8203;‏&#8203;قالت لـ زوجھا : [ علمني قيادھ السيارھ &#58974; ] !&#8233;فقال لہـا : انتـي گالملگھ . .  &#8233;والملكھ لا تقود يا حبيبتـي&#8233;فقالت لھ : حسنــاً ..&#8233;لن &#1649;قود .. لن أغسـل .. لن أطبـخ !&#8233;لن أربـي الأطفـال !&#8233;لأننـي ” ملگھ “ والملگھ لا تقوم بہذھ المہام &#8233;اضافھ الى اني احتـاج عشرات الخادمـات&#8233;حتى اتفرغ للاهتمام بـ جمالي ;;) &#8233;فقـال لہـا : أمزح معك فديتك =D:s&#8203;&#8203;&#8233;اضغطي الكلتش وعشقي بواحد وارفعي رجلك شوي شوي . . &#8233;&#8233;&#8233;ههههههههههههههههههههههههههههههههههههههههه<!-- google_ad_section_end --></div>



]]></content:encoded>
            <category domain="http://forum.mn66.com/f16/">نكت - jokes - ضحك و الصرقعه</category>
            <dc:creator>*ام ماهر*</dc:creator>
            <guid isPermaLink="true">http://forum.mn66.com/t312645.html</guid>
        </item>

Последние два дня я искал ответ в Интернете. Любая помощь будет принята с благодарностью.

logcat:

11-29 12: 48: 32.649: E / AndroidRuntime (26821): ИСКЛЮЧИТЕЛЬНОЕ ИСКЛЮЧЕНИЕ: основное 11-29 12: 48: 32.649: E / AndroidRuntime (26821): java.lang.NullPointerException 11-29 12: 48: 32.649: E / AndroidRuntime (26821): в com.lascivio.womenworld.RSSSection $ EfficientAdapter.getCount (RSSSection.java:161) 11-29 12: 48: 32.649: E / AndroidRuntime (26821): в android.widget.ListView.setAdapter (ListView.java:502) 11-29 12: 48: 32.649: E / AndroidRuntime (26821): в com.lascivio.womenworld.RSSSection $ GetData.onPostExecute (RSSSection.java:90) 11-29 12: 48: 32.649: E / AndroidRuntime (26821): в com.lascivio.womenworld.RSSSection $ GetData.onPostExecute (RSSSection.java:1) 11-29 12: 48: 32.649: E / AndroidRuntime (26821): в android.os.AsyncTask.finish (AsyncTask.java:417) 11-29 12: 48: 32.649: E / AndroidRuntime (26821): в android.os.AsyncTask.access $ 300 (AsyncTask.java:127) 11-29 12: 48: 32.649: E / AndroidRuntime (26821): в android.os.AsyncTask $ InternalHandler.handleMessage (AsyncTask.java:429) 11-29 12: 48: 32.649: E / AndroidRuntime (26821): в android.os.Handler.dispatchMessage (Handler.java:99) 11-29 12: 48: 32.649: E / AndroidRuntime (26821): в android.os.Looper.loop (Looper.java:123) 11-29 12: 48: 32.649: E / AndroidRuntime (26821): в android.app.ActivityThread.main (ActivityThread.java:3687) 11-29 12: 48: 32.649: E / AndroidRuntime (26821): в java.lang.reflect.Method.invokeNative (родной метод) 11-29 12: 48: 32.649: E / AndroidRuntime (26821): в java.lang.reflect.Method.invoke (Method.java:507) 11-29 12: 48: 32.649: E / AndroidRuntime (26821): в com.android.internal.os.ZygoteInit $ MethodAndArgsCaller.run (ZygoteInit.java:867) 11-29 12: 48: 32.649: E / AndroidRuntime (26821): в com.android.internal.os.ZygoteInit.main (ZygoteInit.java:625) 11-29 12: 48: 32.649: E / AndroidRuntime (26821): в dalvik.system.NativeStart.main (собственный метод)

Вот код, где происходит анализ.

private RSSFeed getFeed(String urlToRssFeed)
{
    try
    {
        // setup the url
        URL url = new URL(urlToRssFeed);

        // create the factory
        SAXParserFactory factory = SAXParserFactory.newInstance();
        // create a parser
        SAXParser parser = factory.newSAXParser();

        // create the reader (scanner)
        XMLReader xmlreader = parser.getXMLReader();
        // instantiate our handler
        RSSHandler theRssHandler = new RSSHandler();
        // assign our handler
        xmlreader.setContentHandler(theRssHandler);
        // get our data via the url class
        InputSource is = new InputSource(url.openStream());




        // perform the synchronous parse           
        xmlreader.parse(is);


        // get the results - should be a fully populated RSSFeed instance, or null on error
        return theRssHandler.getFeed();
    }
    catch (Exception ee)
    {
        // if we have a problem, simply return null
        return null;
    }
}

Ответы [ 2 ]

5 голосов
/ 01 декабря 2011

попробуйте это:

Reader r = new InputStreamReader(url.openStream(), "windows-1256");
InputSource is = new InputSource(r);
xmlreader.parse(is);
0 голосов
/ 29 ноября 2011

Попробуйте добавить это: is.setEncoding("Cp1256"); после этой строки InputSource is = new InputSource(url.openStream());

...