Генерация простого AST в ANTLR - PullRequest
2 голосов
/ 10 ноября 2010

Я немного поиграюсь с ANTLR и хочу создать такую ​​функцию:

MOVE x y z pitch roll

Это производит следующее AST:

 MOVE
   |---x
   |---y
   |---z
   |---pitch
   |---roll

До сих пор я пытался без удачи, и я продолжаю заставлять AST иметь параметры как родные, а не детские.

Код до сих пор:

C #:

class Program
{
    const string CRLF = "\r\n";

    static void Main(string[] args)
    {
        string filename = "Script.txt";

        var reader = new StreamReader(filename);
        var input = new ANTLRReaderStream(reader);
        var lexer = new ScorBotScriptLexer(input);
        var tokens = new CommonTokenStream(lexer);
        var parser = new ScorBotScriptParser(tokens);

        var result = parser.program();
        var tree = result.Tree as CommonTree;
        Print(tree, "");

        Console.Read();
    }

    static void Print(CommonTree tree, string indent)
    {
        Console.WriteLine(indent + tree.ToString());

        if (tree.Children != null)
        {
            indent += "\t";

            foreach (var child in tree.Children)
            {
                var childTree = child as CommonTree;

                if (childTree.Text != CRLF)
                {
                    Print(childTree, indent);
                }
            }    
        }            
    }

ANTLR:

grammar ScorBotScript;

options
{
    language     = 'CSharp2';
    output       = AST;
    ASTLabelType = CommonTree;
    backtrack    = true;
    memoize      = true;
}

@parser::namespace { RSD.Scripting }
@lexer::namespace { RSD.Scripting }

program
    : (robotInstruction CRLF)*
    ;

robotInstruction
    : moveCoordinatesInstruction
    ;

/**
 * MOVE X Y Z PITCH ROLL
 */
moveCoordinatesInstruction
    : 'MOVE' x=INT y=INT z=INT pitch=INT roll=INT
    ;

INT : '-'? ( '0'..'9' )*
    ;

COMMENT
    :   '//' ~( CR | LF )* CR? LF { $channel = HIDDEN; }
    ;

WS
    :   ( ' ' | TAB | CR | LF ) { $channel = HIDDEN; }
    ;

ID  :   ('a'..'z'|'A'..'Z'|'_') ('a'..'z'|'A'..'Z'|'0'..'9'|'_')*
    ;

STRING
    :  '"' ( ESC_SEQ | ~('\\'|'"') )* '"'
    ;

fragment
ESC_SEQ
    :   '\\' ('b'|'t'|'n'|'f'|'r'|'\"'|'\''|'\\')
    ;

fragment TAB 
    : '\t' 
    ;

fragment CR 
    : '\r' 
    ;

fragment LF 
    : '\n' 
    ;

CRLF
    : (CR ? LF) => CR ? LF
    | CR
    ;

parse
    : ID
    | INT
    | COMMENT
    | STRING
    | WS
    ;

1 Ответ

7 голосов
/ 10 ноября 2010

Я новичок в ANTLR, меня это тоже смутило.

Я думаю, что если вы хотите создать дерево из вашей грамматики со структурой, вы дополняете свою грамматику подсказками, используя символы ^ и !. Эта страница примеров показывает, как.

со связанной страницы:

По умолчанию ANTLR создает деревья как "списки братьев и сестер".

Грамматика должна быть аннотирована дерево команд для создания парсера, который создает деревья в правильной форме (то есть операторы в корне, которые операнды как дети). Несколько больше сложный анализатор выражений может быть видел здесь и скачал в виде tar Вот. Обратите внимание, что грамматические терминалы который должен быть в корне поддерево помечено ^.

...