我正在尝试创建一个解析器,将一些数学转换为C。这归结为必须找到形式为…^x的嵌套表达式,并用pow(…,x)替换它(这里x是一个数字)。你知道吗
一些假设:
我可以澄清更多的假设,如果我错过了什么(只是问)。你知道吗
下面是我的代码,还有一个失败的例子。为什么会失败?你知道吗
代码:
from pyparsing include *
def parse(s):
identifier = Regex(r'-?[a-zA-Z0-9_]+')
real = Regex(r'-?[0-9]+(\.?[0-9]+)?(e-?[0-9]+)?')
oper = Regex(r'[\*\+/-]-?')
#oper = oneOf("* + - /")
# define arithOperand as a Forward, since it could contain nested power expression
arithOperand = Forward()
arithExpr = arithOperand + ZeroOrMore(oper + arithOperand)
groupedArithExpr = '(' + arithExpr + ')'
# define expression for x^y, where x could be any kind of arithmetic term
powerOp = Literal('^')
powerExpr = (groupedArithExpr|real|identifier) + powerOp + real #order matters?
powerExpr.setParseAction(lambda tokens: 'pow(%s,%s)' % (tokens[0], tokens[2]))
# now define the possible expressions for arithOperand, including a powerExpr
arithOperand <<= powerExpr | real | identifier | groupedArithExpr
# convert parsed list of strings to a single string
groupedArithExpr.setParseAction(''.join)
return arithExpr.transformString(s)
导致失败的字符串:
s = ((s9*(s4*s6+c4*c6*s5)-c5*c6*c9)*(-(c4*s6-c6*s4*s5)*(x1*(1.0/2.0)+BASE_ORIGIN_Z*(s4*s6+c4*c6*s5)+(c4*s6-c6*s4*s5)*(-BASE_ORIGIN_Y+BASE_LINK_EXTENTS_Y*(1.0/2.0)+LEG_LINK_EXTENTS_Y*(1.0/2.0))+BASE_ORIGIN_X*c5*c6)+(c4*c6+s4*s5*s6)*(x2*(1.0/2.0)-BASE_ORIGIN_Z*(c6*s4-c4*s5*s6)-(c4*c6+s4*s5*s6)*(-BASE_ORIGIN_Y+BASE_LINK_EXTENTS_Y*(1.0/2.0)+LEG_LINK_EXTENTS_Y*(1.0/2.0))+BASE_ORIGIN_X*c5*s6)+c5*s4*(x3*(1.0/2.0)-BASE_ORIGIN_X*s5+BASE_ORIGIN_Z*c4*c5-c5*s4*(-BASE_ORIGIN_Y+BASE_LINK_EXTENTS_Y*(1.0/2.0)+LEG_LINK_EXTENTS_Y*(1.0/2.0))))+(c4*s6-c6*s4*s5)*((c9*s5+c4*c5*s9)*(x3*(1.0/2.0)-BASE_ORIGIN_X*s5+BASE_ORIGIN_Z*c4*c5-c5*s4*(-BASE_ORIGIN_Y+BASE_LINK_EXTENTS_Y*(1.0/2.0)+LEG_LINK_EXTENTS_Y*(1.0/2.0)))+(s9*(s4*s6+c4*c6*s5)-c5*c6*c9)*(x1*(1.0/2.0)+BASE_ORIGIN_Z*(s4*s6+c4*c6*s5)+(c4*s6-c6*s4*s5)*(-BASE_ORIGIN_Y+BASE_LINK_EXTENTS_Y*(1.0/2.0)+LEG_LINK_EXTENTS_Y*(1.0/2.0))+BASE_ORIGIN_X*c5*c6)-(s9*(c6*s4-c4*s5*s6)+c5*c9*s6)*(x2*(1.0/2.0)-BASE_ORIGIN_Z*(c6*s4-c4*s5*s6)-(c4*c6+s4*s5*s6)*(-BASE_ORIGIN_Y+BASE_LINK_EXTENTS_Y*(1.0/2.0)+LEG_LINK_EXTENTS_Y*(1.0/2.0))+BASE_ORIGIN_X*c5*s6)))^2
这里的指数不转换为pow,整个输入表达式保持不变,没有任何更改。我的解析器怎么了?你知道吗
我认为您唯一缺少的是您没有处理前导的一元“-”运算符。这可以很容易地合并到算术表达式中,使用:
进行此更改后,代码将生成此输出(不包含“^”运算符):
编辑:(一些化妆品清理)
为了将操作数保持为单个可计算组,最好使用以下方法定义:
另外,添加一元减号将允许删除添加到real和identifier的前导“-”。你知道吗
关于你的问题“订单重要吗”-是的。幸运的是,您已经将powerExpr置于groupedArithExpr之前,这是唯一两个可能导致问题的替代方案。如果这两个表达式的顺序相反,那么我认为powerExpr永远不会得到正确的计算,因为前面的()分组表达式将使用groupedArithExpr表达式进行解析,从而在powerExpr后面的“^”字符处留下一个解析错误。您可以将“|”运算符(“match first”)更改为“^”运算符(“match longest”),这将强制评估所有备选方案并选择最长的匹配。但是在递归语法中,“match longest”可以运行得非常慢,甚至可以永远递归,所以我鼓励人们设计“match first”。你知道吗
编辑2:
别管小组了,我忘了你只是在这里做转换字符串-坚持你原来的:
但仔细看,我发现标识符确实太宽了,它将匹配整数和标识符。最好在这里使用两个参数的单词(不要担心速度-Word将在内部构建并使用正则表达式进行匹配):
EDIT3:为了方便起见,我写了一个函数来缩进你的怪物的例子:
相关问题 更多 >
编程相关推荐