Я бы пошел на что-то вроде этого:
grammar T;
options {
output=AST;
}
tokens {
ROOT;
MEMBER;
INDEX;
CALL;
}
parse
: unary_expression EOF -> ^(ROOT unary_expression)
;
unary_expression
: postfix_expression
| unary_operator unary_expression -> ^(unary_operator unary_expression)
;
postfix_expression
: primary_expression tail* -> ^(primary_expression tail*)
;
tail
: '[' expression ']' -> ^(INDEX expression)
| '(' argument_expression_list? ')' -> ^(CALL argument_expression_list?)
| '.' ID -> ^(MEMBER ID)
;
primary_expression
: ID
| '(' expression ')' -> expression
;
argument_expression_list
: expression (',' expression)* -> expression+
;
unary_operator
: '+'
| '-'
| '~'
| '!'
;
expression
: NUMBER
| ID
;
NUMBER : '0'..'9'+;
ID : ('a'..'z' | 'A'..'Z')+;
, который будет анализировать ввод:
a.b.c(foo,42)[123]
в следующие AST:
облегчает вычисление выражения слева направо.