如何使用tokezine/untokenize？

from tokenize import tokenize, untokenize from io import BytesIO def retoken(text): result = [] g = tokenize(BytesIO(text.encode('utf-8')).readline) # tokenize the string for toknum, tokval, _, _, _ in g: result.append((toknum, tokval)) return untokenize(result).decode('utf-8') code = "x.y=12" print("CODE:", code) print("RETOKEN:", retoken(code))

1条回答

网友

1楼 · 发布于 2024-04-20 07:41:15

untokenize的文档说明

[...] the spacing between tokens (column positions) may change.

我怀疑untokenize在构建输出字符串时没有检查它的整个标记列表。它似乎在标识符令牌之后添加了一个空格，因为该字符保证不是前面的标识符令牌的一部分，也不是后面的任何令牌的一部分，或者是令牌本身。这有助于确保tokenize(untokenize(tokenize(s))) == tokenize(s)，即使untokenize(tokenize(s))可能不等于s。你知道吗

编程相关推荐

java动态包含和排除MavReplugin
javadspace安装问题
java矩阵乘法mapreduce
java获取jsp中的当前页面apache分幅
域名和应用程序名相同时的安卓 Java包命名
java无法调用“javafx.scene.control.ComboBox.getItems（）”，因为“Controller.getMyBox（）”的返回值为空
从projectoxford导入的java手写识别操作不再工作
java如何在日志中打印RESTJSON请求/响应？
java StringTokenizer NoSuchElementExecption错误
java插入查询未执行或均未给出异常

相关问题更多 >

编程相关推荐

热门问题

热门文章