所以我有以下字符串(每个字符串是.txt文件中的一行),我构建了一个解析器来解析第一行,如下所示:
line1: " N1 0.00000000 0.00000000 0.00000000 Type N Rank 4"
parser1 = Word(alphas + nums) + Word(printables + '.' + printables) + Word(printables + '.' + printables) \
+ Word(printables + '.' + printables) + Word(alphas) + Word(alphas) + Word(alphas) + Word(nums)
result = (['N1', '0.00000000', '0.00000000', '0.00000000', 'Type', 'N', 'Rank', '4'], {})
太棒了。但是,在这一行后面只跟一些浮点数,这些浮点数可能有,也可能没有负号,例如:
^{2}$我尝试使用下面的解析器来获取这些数字,但不幸的是,它也会抓取第1行:
parser2 = Word(printables + '.' + printables)
有没有一种方法可以更好地解析float,包括可打印的减号?在
非常感谢(我是pyparsing新手,所以您可以随意使用)
Word(printables + '.' + printables)
不执行您的想法。printables
是一个字符串,因此printables + '.' + printables
计算结果是一个包含所有可打印字符的真的长字符串,后跟一个句点,然后是所有可打印字符。然后使用这个字符串构造一个Word
对象,它将匹配所有可打印字符集中以空格分隔的字符组(由于“.”是可打印的,因此它已经在该集合中)。在我怀疑你真正想用来解析一个带有可选前导负号的实数的东西是
注意,添加是通过解析表达式完成的,而不是传递给Word的字符串。这将把'-1.23'解析为
^{pr2}$['-', '1', '.', '23']
。要将所有这些作为一个字符串,请将其包装在一个组合中:然后使用该表达式得到'-1.23'。之后仍然需要使用
float()
内置函数将其转换为Python浮点。在pyparsing_common.real
是一个预定义的浮点解析表达式,它将处理前导符号,和在解析时从字符串转换为float,这样当您从解析器获取值时,它已经被转换为float。在相关问题 更多 >
编程相关推荐