我试图在python中实现以下替换。将所有html标记替换为{n}
&创建[tag,{n}]
原始字符串->;“<h>
这是一个字符串。</H><P>
这是另一部分。</P>
“
替换了文本->;“{0}这是一个字符串。{1} {2}这是另一部分。{3} ““
这是我的密码。我已经从替换开始了,但是我仍然停留在替换逻辑上,因为我无法找到以连续的方式替换每个事件的最佳方法,例如用{0}、{1}等等:
import re
text = "<h> This is a string. </H><p> This is another part. </P>"
num_mat = re.findall(r"(?:<(\/*)[a-zA-Z0-9]+>)",text)
print(str(len(num_mat)))
reg = re.compile(r"(?:<(\/*)[a-zA-Z0-9]+>)",re.VERBOSE)
phctr = 0
#for phctr in num_mat:
# phtxt = "{" + str(phctr) + "}"
phtxt = "{" + str(phctr) + "}"
newtext = re.sub(reg,phtxt,text)
print(newtext)
有人能帮我找到更好的方法吗?谢谢您!在
印刷品
^{pr2}$仅适用于简单标记(标记中没有属性/空格)。对于扩展标记,您必须调整regexp。在
另外,不重新初始化
cnt = it.count()
将继续编号。在更新获取映射dict:
印刷品:
相关问题 更多 >
编程相关推荐