Что не так с этой грамматикой?(ANTLRWorks 1.4) - PullRequest
2 голосов
/ 26 сентября 2010

У меня есть следующий код, написанный в ANTLRWorks 1.4

grammar hmm;

s           :   (put_a_in_b)|(put_out_a)|(drop_kick)|(drop_a)|(put_on_a);

put_a_in_b  :   (PUT_SYN)(ID)(IN_SYN)(ID);  
put_out_a   :   (PUT2_SYN)(OUT_SYN)(ID) | (E1)(ID); 
drop_kick   :   ('drop')('kick')(ID);
drop_a      :   (DROP_SYN)(ID);
put_on_a    :   (E2)(ID);

PUT_SYN     :   'put' | 'place' | 'drop';
PUT2_SYN    :   'put' | 'douse';
IN_SYN      :   'in' | 'into' | 'inside' | 'within';    
OUT_SYN     :   'out';
E1          :   'extinguish'|'douse';
DROP_SYN    :   'drop' | 'throw' | 'relinquish';
WS          :   ( ' '  | '\t' | '\r' | '\n' ) {$channel=HIDDEN;};
ID          :   ('a'..'z'|'A'..'Z'|'_') ('a'..'z'|'A'..'Z'|'0'..'9'|'_')*;
E2          :   'put on'|'don'|'wear';
COMMENT
    :   '//' ~('\n'|'\r')* '\r'? '\n' {$channel=HIDDEN;}
    |   '/*' ( options {greedy=false;} : . )* '*/' {$channel=HIDDEN;}
    ;

Когда я запускаю его с помощью ввода:

drop object

Я получаю исключение MismatchedTokenException (5! = 15).

И с вводом:

put o1 in o2

Я получаю NoViableAltException.

Хотя он отлично работает с

place o2 in o2

Я новичок в этомНо кажется, что есть неясности?Или, может быть, мое использование ANTLR неверно?

1 Ответ

2 голосов
/ 26 сентября 2010

Вы поместили 'drop' и 'put' в два разных правила лексера:

PUT_SYN  : 'put' | 'place' | 'drop';          // drop & put
PUT2_SYN : 'put' | 'douse';                   //        put
...
DROP_SYN : 'drop' | 'throw' | 'relinquish';   // drop

Когда лексер встречает put, правило 100 * * всегда будет соответствоватьтаким образом, 'put' может (или должен) быть удален из правила PUT2_SYN.

Итак, ваша проблема с синтаксическим анализом строки drop object: синтаксический анализатор попытается сопоставить drop_a : (DROP_SYN)(ID);, но "drop" будет сопоставлено в правиле лексера PUT_SYN.

РЕДАКТИРОВАТЬ

Эти списки синонимов можно лучше превратить в правила синтаксического анализатора (вместо правил лексера),Вот небольшая демонстрация:

grammar TextAdventure;

parse
  :  command (EndCommand command)* EOF
  ;

command
  :  put_syn_1 OtherWord in_syn OtherWord
  |  put_syn_2 out_syn_1 OtherWord
  |  out_syn_2 OtherWord
  |  Drop Kick OtherWord
  |  drop_syn OtherWord
  ;

drop_syn
  :  Drop
  |  Throw 
  |  Relinquish
  ;

in_syn
  :  In
  |  Into
  |  Inside
  |  Within
  ; 

put_syn_1
  :  Put
  |  Place
  |  Drop
  ;

put_syn_2
  :  Put
  |  Douse
  ;

out_syn_1
  :  Out
  ;

out_syn_2
  :  Extinguish
  |  Douse
  ;

Space      : (' ' | '\t' | '\r' | '\n'){$channel=HIDDEN;};
EndCommand : ';';
Put        : 'put';
Place      : 'place';
Drop       : 'drop';
Douse      : 'douse';
In         : 'in';
Into       : 'into';
Inside     : 'inside';
Within     : 'within';    
Out        : 'out';
Extinguish : 'extinguish';
Throw      : 'throw';
Relinquish : 'relinquish';
Kick       : 'kick';
OtherWord  : ('a'..'z' | 'A'..'Z')+;

При интерпретации следующего источника:

drop object ; put yourself in myshoes ; place it in avase

вы увидите, что ANTLRWorks генерирует следующее дерево разбора:

alt text

...