Если вам разрешено использовать инструмент генератора синтаксических анализаторов, такой как ANTLR, вот как вы можете начать. Грамматика для простого логического языка может выглядеть так:
grammar Logic;
parse
: expression EOF
;
expression
: implication
;
implication
: or ('->' or)*
;
or
: and ('||' and)*
;
and
: not ('&&' not)*
;
not
: '~' atom
| atom
;
atom
: ID
| '(' expression ')'
;
ID : ('a'..'z' | 'A'..'Z')+;
Space : (' ' | '\t' | '\r' | '\n')+ {$channel=HIDDEN;};
Однако, если вы проанализируете ввод, например (P || Q || R) && ((P -> R) -> Q)
, с помощью синтаксического анализатора, сгенерированного из приведенной выше грамматики, дерево синтаксического анализа будет содержать круглые скобки (что вас не заинтересует после анализа выражения), и операторы не будут корень каждого поддерева, который не облегчает вашу жизнь, если вы заинтересованы в оценке выражения.
Вам нужно будет указать ANTLR, что нужно исключить определенные токены из AST (это можно сделать, поместив !
после токена / правила) и сделать определенные токены / правила корнем их (под) дерево (это можно сделать, поместив ^
после него). Наконец, вам необходимо указать в разделе options
вашей грамматики, что вы хотите создать правильное AST вместо простого дерева разбора.
Итак, приведенная выше грамматика будет выглядеть так:
// save it in a file called Logic.g
grammar Logic;
options {
output=AST;
}
// parser/production rules start with a lower case letter
parse
: expression EOF! // omit the EOF token
;
expression
: implication
;
implication
: or ('->'^ or)* // make `->` the root
;
or
: and ('||'^ and)* // make `||` the root
;
and
: not ('&&'^ not)* // make `&&` the root
;
not
: '~'^ atom // make `~` the root
| atom
;
atom
: ID
| '('! expression ')'! // omit both `(` and `)`
;
// lexer/terminal rules start with an upper case letter
ID : ('a'..'z' | 'A'..'Z')+;
Space : (' ' | '\t' | '\r' | '\n')+ {$channel=HIDDEN;};
Вы можете протестировать анализатор с помощью следующего класса:
import org.antlr.runtime.*;
import org.antlr.runtime.tree.*;
import org.antlr.stringtemplate.*;
public class Main {
public static void main(String[] args) throws Exception {
// the expression
String src = "(P || Q || R) && ((P -> R) -> Q)";
// create a lexer & parser
LogicLexer lexer = new LogicLexer(new ANTLRStringStream(src));
LogicParser parser = new LogicParser(new CommonTokenStream(lexer));
// invoke the entry point of the parser (the parse() method) and get the AST
CommonTree tree = (CommonTree)parser.parse().getTree();
// print the DOT representation of the AST
DOTTreeGenerator gen = new DOTTreeGenerator();
StringTemplate st = gen.toDOT(tree);
System.out.println(st);
}
}
Теперь, чтобы запустить класс Main
, выполните:
* NIX / MacOS
java -cp antlr-3.3.jar org.antlr.Tool Logic.g
javac -cp antlr-3.3.jar *.java
java -cp .:antlr-3.3.jar Main
Windows
java -cp antlr-3.3.jar org.antlr.Tool Logic.g
javac -cp antlr-3.3.jar *.java
java -cp .;antlr-3.3.jar Main
, который будет печатать DOT источник следующего AST:
(изображение, полученное с помощью graphviz-dev.appspot.com )
Теперь все вам нужно оценить это AST! :)