Пример HTML-анализатора Android - PullRequest
3 голосов
/ 03 мая 2011

Я искал много HTML-парсер для Android. Я перепробовал много библиотек. Может кто-нибудь, пожалуйста, покажите мне пример, как это сделать. Я хочу извлечь содержимое каждого тега. Пожалуйста помоги. Я застрял с этим.

1 Ответ

12 голосов
/ 03 мая 2011

Пожалуйста, посмотрите на этот список.На самом деле, там много вариантов.Например, я выбрал библиотеку HtmlCleaner для реализации.Ниже приведен пример использования:

Структура проекта:

project

Фактический исходный код:

public class HtmlHelper {
    TagNode rootNode;

    public HtmlHelper(URL htmlPage) throws IOException
    {
        HtmlCleaner cleaner = new HtmlCleaner();
        rootNode = cleaner.clean(htmlPage);
    }

    List<TagNode> getLinksByClass(String CSSClassname)
    {
        List<TagNode> linkList = new ArrayList<TagNode>();

        TagNode linkElements[] = rootNode.getElementsByName("a", true);
        for (int i = 0; linkElements != null && i < linkElements.length; i++)
        {
            String classType = linkElements[i].getAttributeByName("class");
            if (classType != null && classType.equals(CSSClassname))
            {
                linkList.add(linkElements[i]);
            }
        }

        return linkList;
    }
}

public class StackParser extends Activity {
    /** Called when the activity is first created. */
    @Override
    public void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.main);

        Button button = (Button)findViewById(R.id.parse);
        button.setOnClickListener(myListener);
    }

    private ProgressDialog pd;

    private OnClickListener myListener = new OnClickListener() {
        public void onClick(View v) {
            pd = ProgressDialog.show(StackParser.this, "Working...", "request to server", true, false);
            new ParseSite().execute("http://www.stackoverflow.com");
        }
    };

    private class ParseSite extends AsyncTask<String, Void, List<String>> {

        protected List<String> doInBackground(String... arg) {
            List<String> output = new ArrayList<String>();

            try
            {
                HtmlHelper hh = new HtmlHelper(new URL(arg[0]));
                List<TagNode> links = hh.getLinksByClass("question-hyperlink");

                for (Iterator<TagNode> iterator = links.iterator(); iterator.hasNext();)
                {
                    TagNode divElement = (TagNode) iterator.next();
                    output.add(divElement.getText().toString());
                }
            }
            catch(Exception e)
            {
                e.printStackTrace();
            }

            return output;
        }

        protected void onPostExecute(List<String> output) {

            pd.dismiss();

            ListView listview = (ListView) findViewById(R.id.listViewData);
            listview.setAdapter(new ArrayAdapter<String>(StackParser.this, android.R.layout.simple_list_item_1 , output));
        }
    }
}
...