Вывести список тегов HTML из строки - PullRequest
1 голос
/ 05 марта 2012

У меня есть строка, из которой я хочу перечислить все присутствующие в ней теги HTML.Есть ли библиотека для этой работы?

Любая информация будет очень полезна для меня.

Ответы [ 4 ]

1 голос
/ 05 марта 2012

Вы можете использовать приведенный ниже код для извлечения только тегов HTML из вашей строки.

    package com.overflow.stack;

    /**
     *
     * @author sarath_sivan
     */

    public class ExtractHtmlTags {

        public static void getHtmlTags(String html) {
            int beginIndex = 0;
            while(beginIndex!=-1) {
                beginIndex = html.indexOf("<", 0);
                int endIndex = html.indexOf(">", beginIndex+1);
                String htmlTag = "";
                try {
                    if(beginIndex!=-1) {
                        htmlTag = html.substring(beginIndex, endIndex+1);
                    }
                } catch(Exception e) {
                    e.printStackTrace();
                }
                System.out.println(htmlTag);
                html = html.substring(endIndex+1, html.length());
            }
        }

        public static void main(String[] args) {
            String html = "<html><body><h2>List HTML tags from a String</h2>hello<br /></body></html>";
            ExtractHtmlTags.getHtmlTags(html);
        }

    }

Но я не понимаю, что вы пытаетесь делать с извлеченными тегами HTML.Удачи!

1 голос
/ 05 марта 2012

Вы можете попробовать http://jsoup.org/ Не уверен, что он позволяет получить список тегов, но вы можете получить список с итерацией DOM.

0 голосов
/ 05 марта 2012
page = Nokogiri::HTML(open('http://yoursite.com'))
page.css("*").map{|x| x.name}.flatten.uniq
0 голосов
/ 05 марта 2012

Парсер из HTMLUnit может взять строку и вернуть структурированный результат:

http://htmlunit.sourceforge.net/apidocs/com/gargoylesoftware/htmlunit/html/HTMLParser.html

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...