如何用Python转换八进制转义序列
我从PDF文件中提取了JavaScript代码,但它被转换成了八进制转义序列。
我想把它转换回正常的JavaScript代码。
\040\040\040\040\146\165\156\143\164\151\157\156\040\163\167\050\051\17....
请给我一些建议。
2 个回答
3
你可以使用 unicode_escape
编码:
在 Python 2.x 中:
>>> r'\040\040\040\040\146\165\156\143\164\151\157\156'.decode('unicode-escape')
u' function'
在 Python 3.x 中:
>>> br'\040\040\040\040\146\165\156\143\164\151\157\156'.decode('unicode-escape')
' function'
1
这个方法在Python 2.x和3.x版本中都适用:
>>> b'\040\040\040\040\146\165\156\143\164\151\157\156\040\163\167'.decode('utf-8')
' function sw'