Parse :: RecDescent и операторы с кавычками - PullRequest
1 голос
/ 04 апреля 2019

У меня есть что-то вроде следующего:

((x=2 or y=3 ) and (r=3 and c=3) or (x=5 and g=6))

Я определил:

Token : /\w \= \d/
operator or|and
expression : token operator(s)
quoted_expression : "("expression")"
query : expression (s)|quoted_expression(s)

Но у меня есть проблема с синтаксическим анализом вышеприведенного условия, есть идеи, как разобрать вышеприведенное?

1 Ответ

3 голосов
/ 04 апреля 2019

По сути, вы хотите

expr    : log_or

log_or  : log_or 'or' log_and
        | log_and

log_and : log_and 'and' cmp
        | cmp

cmp     : cmp /=|<[>=]?|>=?/ term
        | term

term    : '(' expr ')'
        | IDENT
        | NUMBER

После , исключив левую рекурсию и добавив необходимые блоки кода, вы получите следующее:

my $grammar = <<'__EOS__';

   {
      # The code in rules is also covered by these pragmas.
      use strict;
      use warnings;
   }

   parse    : expr /\Z/ { $item[1] }

   # ----------------------------------------
   # Rules

   expr     : log_or { $item[1] }

   # ---vvv--- Lowest precedence ---vvv---

   log_or   : log_and log_or_[ $item[1] ]
   log_or_  : 'or' log_and log_or_[ [ $item[1], $arg[0], $item[2] ] ]
            | { $arg[0] }

   log_and  : cmp log_and_[ $item[1] ]
   log_and_ : 'and' cmp log_and_[ [ $item[1], $arg[0], $item[2] ] ]
            | { $arg[0] }

   cmp      : term cmp_[ $item[1] ]
   cmp_     : /=|<[>=]?|>=?/ term cmp_[ [ $item[1], $arg[0], $item[2] ] ]
            | { $arg[0] }

   # ---^^^--- Highest precedence ---^^^---

   term     : '(' expr ')' { $item[2] }
            | IDENT  { [ $item[0], $item[1] ] }
            | NUMBER { [ $item[0], $item[1] ] }

   # ----------------------------------------
   # Tokens

   IDENT    : /\w+/
   NUMBER   : /\d+/

__EOS__
...