Вот код python-rply, который я извлек из здесь в качестве примера:
from rply import ParserGenerator, LexerGenerator
from rply.token import BaseBox
lg = LexerGenerator()
# Add takes a rule name, and a regular expression that defines the rule.
lg.add("PLUS", r"\+")
lg.add("MINUS", r"-")
lg.add("NUMBER", r"\d+")
lg.ignore(r"\s+")
# This is a list of the token names. precedence is an optional list of
# tuples which specifies order of operation for avoiding ambiguity.
# precedence must be one of "left", "right", "nonassoc".
# cache_id is an optional string which specifies an ID to use for
# caching. It should *always* be safe to use caching,
# RPly will automatically detect when your grammar is
# changed and refresh the cache for you.
pg = ParserGenerator(["NUMBER", "PLUS", "MINUS"],
precedence=[("left", ['PLUS', 'MINUS'])], cache_id="myparser")
@pg.production("main : expr")
def main(p):
# p is a list, of each of the pieces on the right hand side of the
# grammar rule
return p[0]
@pg.production("expr : expr PLUS expr")
@pg.production("expr : expr MINUS expr")
def expr_op(p):
lhs = p[0].getint()
rhs = p[2].getint()
if p[1].gettokentype() == "PLUS":
return BoxInt(lhs + rhs)
elif p[1].gettokentype() == "MINUS":
return BoxInt(lhs - rhs)
else:
raise AssertionError("This is impossible, abort the time machine!")
@pg.production("expr : NUMBER")
def expr_num(p):
return BoxInt(int(p[0].getstr()))
lexer = lg.build()
parser = pg.build()
class BoxInt(BaseBox):
def __init__(self, value):
self.value = value
def getint(self):
return self.value
В этом базовом коде python-rply вы можете добавлять и вычитать числа. Предположим, я хотел добавить в этот код новый элемент, например, переменную. Из того, что я наблюдаю, мне нужно будет добавить новое правило грамматики main в части @pg.production("main : expr")
непосредственно перед определением функции main
. У меня вопрос, как мне добавить новое main грамматическое правило? Буду ли я просто добавить еще один декоратор, как это:
@pg.production("main : expr")
@pg.production("main : <MY_NEW_ELEMENT_STUFF>")
Если так, есть ли более эффективный способ сделать это (если я добавлю туда еще несколько элементов, это будет очень тесно)?
ПРИМЕЧАНИЕ. Я использую rply , а не ply , но они очень похожи.