Генерация абстрактного синтаксического дерева для исходного кода Java с использованием ANTLR - PullRequest
8 голосов
/ 06 февраля 2012

Как я могу сгенерировать AST из кода Java src, используя ANTLR?
любая помощь?

Ответы [ 2 ]

13 голосов
/ 11 февраля 2012

ОК, вот шаги:

  1. Перейдите на сайт ANTLR и загрузите последнюю версию
  2. Загрузите файлы Java.g и JavaTreeParser.g с здесь .
  3. Запустите следующие команды:

    java -jar antlrTool Java.g
    java -jar antlrTool JavaTreeParser.g
    
  4. Будет сгенерировано 5 файлов:

    1. Java.tokens
    2. JavaLexer.java
    3. JavaParser.java
    4. JavaTreeParser.g
    5. JavaTreeParser.tokens

используйте этот код Java для генерации абстрактного синтаксического дерева и его распечатки:

        String input = "public class HelloWord {"+
                   "public void print(String r){" +
                   "for(int i = 0;true;i+=2)" +
                   "System.out.println(r);" +
                   "}" +
                   "}";

    CharStream cs = new ANTLRStringStream(input);
    JavaLexer jl = new JavaLexer(cs);

    CommonTokenStream tokens = new CommonTokenStream();
    tokens.setTokenSource(jl);
    JavaParser jp = new JavaParser(tokens);
    RuleReturnScope result = jp.compilationUnit();
    CommonTree t = (CommonTree) result.getTree();

    CommonTreeNodeStream nodes = new CommonTreeNodeStream(t);

    nodes.setTokenStream(tokens);

    JavaTreeParser walker = new JavaTreeParser(nodes);

    System.out.println("\nWalk tree:\n");

    printTree(t,0);


    System.out.println(tokens.toString());

    }

public static void printTree(CommonTree t, int indent) {
    if ( t != null ) {
        StringBuffer sb = new StringBuffer(indent);
        for ( int i = 0; i < indent; i++ )
            sb = sb.append("   ");
        for ( int i = 0; i < t.getChildCount(); i++ ) {
            System.out.println(sb.toString() + t.getChild(i).toString());
            printTree((CommonTree)t.getChild(i), indent+1);
        }
    }
}
2 голосов
/ 26 января 2018

Настройки для генерации AST Java SRC с использованием antlr4:

  1. Установите antlr4, вы можете использовать эту ссылку для этого.
  2. После установки загрузите грамматику JAVA отсюда .
  3. Теперь сгенерируйте Java8Lexer и Java8Parser с помощью команды:

    antlr4 -visitor Java8.g4

  4. Это создаст несколько файлов, таких как Java8BaseListener.java Java8BaseVisitor.java Java8Lexer.java Java8Lexer.tokens Java8Listener.java Java8Parser.java Java8.tokens Java8Visitor.java

Используйте этот код для генерации AST:

import java.io.File;
import java.io.IOException;

import java.nio.charset.Charset;
import java.nio.file.Files;

import org.antlr.v4.runtime.ANTLRInputStream;
import org.antlr.v4.runtime.CommonTokenStream;
import org.antlr.v4.runtime.ParserRuleContext;
import org.antlr.v4.runtime.RuleContext;
import org.antlr.v4.runtime.tree.ParseTree;

public class ASTGenerator {

    public static String readFile() throws IOException {
        File file = new File("path/to/the/test/file.java");
        byte[] encoded = Files.readAllBytes(file.toPath());
        return new String(encoded, Charset.forName("UTF-8"));
    }

    public static void main(String args[]) throws IOException {
        String inputString = readFile();
        ANTLRInputStream input = new ANTLRInputStream(inputString);
        Java8Lexer lexer = new Java8Lexer(input);
        CommonTokenStream tokens = new CommonTokenStream(lexer);
        Java8Parser parser = new Java8Parser(tokens);
        ParserRuleContext ctx = parser.classDeclaration();

        printAST(ctx, false, 0);
    }

    private static void printAST(RuleContext ctx, boolean verbose, int indentation) {
        boolean toBeIgnored = !verbose && ctx.getChildCount() == 1 && ctx.getChild(0) instanceof ParserRuleContext;

        if (!toBeIgnored) {
            String ruleName = Java8Parser.ruleNames[ctx.getRuleIndex()];
            for (int i = 0; i < indentation; i++) {
                System.out.print("  ");
            }
            System.out.println(ruleName + " -> " + ctx.getText());
        }
        for (int i = 0; i < ctx.getChildCount(); i++) {
            ParseTree element = ctx.getChild(i);
            if (element instanceof RuleContext) {
                printAST((RuleContext) element, verbose, indentation + (toBeIgnored ? 0 : 1));
            }
        }
    }
}

После того, как вы закончили писать код, вы можете использовать gradle для создания вашего проекта или вы можете загрузить antlr-4.7.1-complete.jar в каталог вашего проекта и начать компиляцию.

Если вы хотите получить вывод в DOT-файле, чтобы вы могли визуализировать AST, вы можете обратиться к этой заметке QnA или напрямую обратиться к репозиторию , в котором у меня есть использовал gradle для создания проекта.

Надеюсь, это поможет. :)

...