Лексер ANTLR не соответствует токенам - PullRequest
1 голос
/ 09 апреля 2010

У меня есть простая грамматика ANTLR, которую я сократил до самого базового, чтобы продемонстрировать эту проблему. Я использую ANTLRworks 1.3.1.

grammar sample;

assignment  :  IDENT ':=' NUM ';' ;

IDENT       :  ('a'..'z')+ ;

NUM         :  ('0'..'9')+ ;

WS          :  (' '|'\n'|'\t'|'\r')+ {$channel=HIDDEN;} ;

Очевидно, это утверждение принято грамматикой:

x := 99;

Но этот также:

x := @!$()()%99***;

Вывод от интерпретатора ANTLRworks:

ANTLR Диаграмма интерпретатора http://cs.sierracollege.edu/~barry/antlr-lexer.png

Что я делаю не так? Даже другие типовые грамматики, которые идут с ANTLR (такие как грамматика CMinus), демонстрируют это поведение.

1 Ответ

2 голосов
/ 09 апреля 2010

Если вы посмотрите на консоль вашей IDE ANTLRWorks, вы увидите много ошибок лексера.

Попробуйте в командной строке:

grammar Sample;

@members {
  public static void main(String[] args) throws Exception {
    ANTLRStringStream in = new ANTLRStringStream("x := @!$()()\%99***;");
    SampleLexer lexer = new SampleLexer(in);
    CommonTokenStream tokens = new CommonTokenStream(lexer);
    SampleParser parser = new SampleParser(tokens);
    parser.assignment();
  }
}

assignment  :  IDENT ':=' NUM ';' ;

IDENT       :  ('a'..'z')+ ;

NUM         :  ('0'..'9')+ ;

WS          :  (' '|'\n'|'\t'|'\r')+ {$channel=HIDDEN;} ;

и затем:

// generate parser/lexer
java -cp antlr-3.2.jar org.antlr.Tool Sample.g

// compile
javac -cp antlr-3.2.jar *.java

// run Windows
java -cp .;antlr-3.2.jar SampleParser
// or run *nix/MacOS
java -cp .:antlr-3.2.jar SampleParser

даст:

line 1:5 no viable alternative at character '@'
line 1:6 no viable alternative at character '!'
line 1:7 no viable alternative at character '$'
line 1:8 no viable alternative at character '('
line 1:9 no viable alternative at character ')'
line 1:10 no viable alternative at character '('
line 1:11 no viable alternative at character ')'
line 1:12 no viable alternative at character '%'
line 1:15 no viable alternative at character '*'
line 1:16 no viable alternative at character '*'
line 1:17 no viable alternative at character '*'
...