Проверьте максимальное вхождение массива во вложенную функцию, используя ANTLR4 - PullRequest
0 голосов
/ 15 апреля 2020

У меня есть следующий файл грамматики для разбора вложенных функций.

Граммер:

grammar FunctionTokenizer;

parse     : function* EOF;
function  : ID '(' expr_list? ')';
expr_list : expr (',' expr)*;
expr      : expr subscript | function | STRING | NUMBER | ID;
subscript : '[' expr? ']';

STRING    : '"' ~'"'* '"';
NUMBER    : [0-9]+ ('.' [0-9]+)?;
ID        : [a-zA-Z_] [a-zA-Z_0-9]*;
SPACES    : [ \t\r\n]+ -> skip;

Ошибка ввода, так как он имеет квадратную скобку. Я изменил регулярное выражение для лексера как:

ID        : [a-zA-Z_] [a-zA-Z_0-9\\[\\]]*;

Но это дает ошибку.

вход:

split(mul(add(input["data"][0]["name"][]["node"],input["data"][0]),input["data"][0]["name"][]["node"][]),",")

Для приведенного выше ввода я проверяю, какой аргумент имеет максимальные скобки: либо [](empty) or [0-9] квадратные скобки с числом, игнорирующим те, которые имеют одинарные и двойные кавычки, такие как ["1234"] или ['data'].

Для указанного выше входного максимального массива: 3, поскольку аргумент input["data"][0]["name"][]["node"][] имеет Максимальный массив.

Итак, я пытаюсь реализовать реализацию шаблона посетителя, но список выражений не достигает метода visitExpr_list .

Ниже приведена ссылка GitHub для проекта:

https://github.com/VIKRAMAS/CheckMaxArrayInNestedFunction/tree/master

Класс VisitorImplementation:

public class FunctionValidateVisitorImpl  extends FunctionTokenizerBaseVisitor<String>  {


    @Override
    public String visitParse(FunctionTokenizerParser.ParseContext ctx) {
        ParseTree name = ctx.getChild(2);
        String visit = visit(name);
        System.err.println("visit1:::::::::::"+visit);
        return visit(name);
    }


    @Override
    public String visitFunction(FunctionTokenizerParser.FunctionContext ctx) {
        ParseTree name = ctx.getChild(2);
        String visit = visit(name);
        System.err.println("visit2:::::::::::"+visit);
        return visit;
    }


    @Override
    public String visitExpr_list(FunctionTokenizerParser.Expr_listContext ctx) {
        String s="";
        for (int i = 0; i < ctx.getChildCount(); i+=2) {
        if(ctx.getChild(i) instanceof FunctionTokenizerParser.Expr_listContext ) {
            String g=visit(ctx.getChild(i));
            System.err.println("visit3:::::::::::if "+i+"    "+g);
            s=s+g;
        }
        else {
            System.err.println("visit4:::::::::::else  "+i+"    "+ctx.getChild(i).getText());
            s=s+ctx.getChild(i).getText();
        }
        }
        return s;
    }


    public String visitSubscript(FunctionTokenizerParser.SubscriptContext ctx) {
        System.err.println("visit5:::::::::::");
        String s="";
        for (int i = 0; i < ctx.getChildCount(); i++) {
        if(ctx.getChild(i) instanceof FunctionTokenizerParser.SubscriptContext) {
            String g=visit(ctx.getChild(i));
            s=s+g;
        }
        else {
            s=s+ctx.getChild(i).getText();
        }
        }
        return s;
    }


    @Override
    public String visitExpr(FunctionTokenizerParser.ExprContext ctx) {
        System.err.println("visit6:::::::::::");
        String s="";
        for (int i = 0; i < ctx.getChildCount(); i++) {
            if(ctx.getChild(i) instanceof TerminalNodeImpl ) {
                s=s+ctx.getChild(i).getText();
            }
            else {
                String g=visit(ctx.getChild(i));

                s=s+g;
            }
        }

        return s;
    }



}

Класс испытаний:

public class FunctionValidate {


    public static void main(String[] args) {
        try {
            String input = "mul(add(input[\"data\"][0][\"name\"][][\"node\"],input[\"data\"][0]),input[\"data\"][0][\"name\"][][\"node\"][])";
            ANTLRInputStream str = new ANTLRInputStream(input);
            FunctionTokenizerLexer lexer = new FunctionTokenizerLexer(str);
            CommonTokenStream tokens = new CommonTokenStream(lexer);
            FunctionTokenizerParser parser = new FunctionTokenizerParser(tokens);
            parser.removeErrorListeners(); // remove ConsoleErrorListener 
            parser.addErrorListener(new VerboseListener());
             FunctionContext tree = parser.function();
            FunctionValidateVisitorImpl visitor = new FunctionValidateVisitorImpl();
            visitor.visit(tree);
            System.out.println("-->"+tree.toStringTree( parser ));
            AST ast=new AST(tree);
            System.out.println( "Improved ParseTree:\n" + ast.toString() );
            JFrame frame = new JFrame("Antlr AST");
            JPanel panel = new JPanel();
            TreeViewer viewr = new TreeViewer(Arrays.asList(
            parser.getRuleNames()),tree);
            viewr.setScale(1.5);
            panel.add(viewr);
            frame.add(panel);
            frame.setDefaultCloseOperation(JFrame.EXIT_ON_CLOSE);
            frame.setSize(500,500);
            frame.setVisible(true);
        } catch (Exception e) {
            e.printStackTrace();
        } 
    }



}

enter image description here

Реализация на посетителях работает для одного аргумент, но если я передам несколько аргументов, это не удается. input:

split(rrr(test(input[\"data\"][0]),input[\"data\"]),input[\"data\"])[]

ouput:

visit4:::::::::::else  0    rrr(test(input["data"][0]),input["data"])
visit4:::::::::::else  2    input["data"]
visit2:::::::::::rrr(test(input["data"][0]),input["data"])input["data"]

После метода списка выражений, непосредственно иначе l oop выполняется, но он должен вызвать метод посещения. Сбой экземпляра условия списка выражений, поэтому вызов метода напрямую достигает else.

1 Ответ

2 голосов
/ 15 апреля 2020

Для ввода типа bar["foo"], ["foo"] - это не то, что вы хотите приклеить к своему bar в своем лексере. Это то, что синтаксический анализатор должен распознавать как выражение.

Как насчет чего-то вроде этого:

expr      : expr subscript | function | STRING | NUMBER | ID;
subscript : '[' expr? ']';

Это также соответствует foo()[42]. Если вы хотите сопоставлять только идентификаторы, которым предшествует subscript, измените expr subscript на ID subscript.

...