Подсветка синтаксиса в JEditorPane в Java - PullRequest
0 голосов
/ 11 ноября 2010

Я хочу выполнить подсветку синтаксиса в jEditorPane. Это позволяет мне выполнять подсветку синтаксиса в одну строку, но если тег XML разбит на две или более строки, он не работает. Ниже приведен код, который я использую для подсветки синтаксиса. Помоги мне с этим. Спасибо .....

public class XmlView extends PlainView {

    private static HashMap<Pattern, Color> patternColors;
    private static String TAG_PATTERN = "(</?[A-Za-z\\-_0-9]*)\\s?>?";
    private static String TAG_END_PATTERN = "(/>)";
    private static String TAG_ATTRIBUTE_PATTERN = "\\s(\\w*)\\=";
    private static String TAG_ATTRIBUTE_VALUE = "[a-z\\-]*\\=(\"[^\"]*\")";
    private static String TAG_COMMENT = "(<\\!--[\\w * \\S]*-->)";
    private static String TAG_CDATA = "(<\\!\\[CDATA\\[.*\\]\\]>)";

    static {
        // NOTE: the order is important!
        patternColors = new LinkedHashMap<Pattern, Color>();
        patternColors.put(Pattern.compile(TAG_PATTERN), new Color(163, 21, 21));
        patternColors.put(Pattern.compile(TAG_CDATA), Color.GRAY);
        patternColors.put(Pattern.compile(TAG_ATTRIBUTE_PATTERN), new Color(127, 0, 127));
        patternColors.put(Pattern.compile(TAG_END_PATTERN), new Color(63, 127, 127));
        patternColors.put(Pattern.compile(TAG_ATTRIBUTE_VALUE), new Color(42, 0, 255));
        patternColors.put(Pattern.compile(TAG_COMMENT), new Color(0, 128, 0));
    }

    public XmlView(Element element) {

        super(element);

        // Set tabsize to 4 (instead of the default 8)
        getDocument().putProperty(PlainDocument.tabSizeAttribute, 4);
    }

    @Override
    protected int drawUnselectedText(Graphics graphics, int x, int y, int p0,
            int p1) throws BadLocationException {

        Document doc = getDocument();
        String text = doc.getText(p0, p1 - p0);

        Segment segment = getLineBuffer();

        SortedMap<Integer, Integer> startMap = new TreeMap<Integer, Integer>();
        SortedMap<Integer, Color> colorMap = new TreeMap<Integer, Color>();

        // Match all regexes on this snippet, store positions
        for (Map.Entry<Pattern, Color> entry : patternColors.entrySet()) {

            Matcher matcher = entry.getKey().matcher(text);

            while (matcher.find()) {
                startMap.put(matcher.start(1), matcher.end());
                colorMap.put(matcher.start(1), entry.getValue());
            }
        }

        // TODO: check the map for overlapping parts

        int i = 0;

        // Colour the parts
        for (Map.Entry<Integer, Integer> entry : startMap.entrySet()) {
            int start = entry.getKey();
            int end = entry.getValue();

            if (i < start) {
                graphics.setColor(Color.black);
                doc.getText(p0 + i, start - i, segment);
                x = Utilities.drawTabbedText(segment, x, y, graphics, this, i);
            }

            graphics.setColor(colorMap.get(start));
            i = end;
            doc.getText(p0 + start, i - start, segment);
            x = Utilities.drawTabbedText(segment, x, y, graphics, this, start);
        }

        // Paint possible remaining text black
        if (i < text.length()) {
            graphics.setColor(Color.black);
            doc.getText(p0 + i, text.length() - i, segment);
            x = Utilities.drawTabbedText(segment, x, y, graphics, this, i);
        }

        return x;
    }

}

Ответы [ 2 ]

3 голосов
/ 11 ноября 2010

Ваши регулярные выражения для тегов, комментариев и разделов CDATA необходимо разделить на две части:

Pattern TAG_START     = Pattern.compile("</?[\\w-]+");
Pattern TAG_END       = Pattern.compile("/?>");
Pattern COMMENT_START = Pattern.compile("<!--");
Pattern COMMENT_END   = Pattern.compile("-->");
Pattern CDATA_START   = Pattern.compile("<\\[CDATA\\[");
Pattern CDATA_END     = Pattern.compile("\\]\\]>");

Когда вы получаете совпадение с одним из шаблонов *_START, вы устанавливаете флаг, указывающий, чтоВы находитесь в другом режиме.Например, совпадение на TAG_START переводит вас в режим TAG, что означает, что вы находитесь внутри тега.Каждый режим поставляется с собственным набором шаблонов, некоторые из которых используются совместно с другими режимами, а некоторые - для конкретного режима.

Например, в режиме по умолчанию вы ищете шаблоны *_START, перечисленные выше, а также любые другие подходящие шаблоны.В режиме TAG вы ищите пары атрибут / значение и шаблон TAG_END, которые не имеют смысла вне тега.И вы всегда ищете шаблон TAG_END first , чтобы убедиться, что вы все еще в теге.(Или какой *_END шаблон применяется к режиму, в котором вы находитесь.)

Поскольку режимы могут сохраняться за границами линий, это означает, что вы должны либо сохранить какое-то состояние между рисованием одной линии и рисованием следующей (сложно) или сканировать весь документ каждый раз, когда вы рисуете линию (медленно).И какой бы подход вы ни выбрали, производительность во многом зависит от качества регулярных выражений.Например, ваше регулярное выражение:

"(<\\!--[\\w * \\S]*-->)"

... будет первоначально потреблять все, начиная с <!-- до конца документа, только для того, чтобы откатить потенциально очень длинный путь.Кроме того, если есть два или более комментариев, они будут совпадать с начала первого до конца последнего.По обеим этим причинам я написал бы это так:

"<!--[^-]*+(?>-(?!->))*+-->"

Обратите внимание на использование собственнических квантификаторов (*+) и атомных групп ((?>...)).Они не нужны с точки зрения правильности, но они делают регулярное выражение намного более эффективным, что будет особенно важно в этом проекте.

Еще одна вещь: если вы собираетесь использовать для этого find(), вы также должны добавить \G (привязку конца последнего совпадения) к началу каждого регулярного выражения, как Friedlсделал в это регулярное выражение из своей книги .

0 голосов
/ 11 ноября 2010

Вам может понадобиться использовать флаг Pattern.MULTILINE?

, например

Pattern.compile(TAG_PATTERN, Pattern.MULTILINE)
...