我使用Beautiful Soup将模式的出现替换为HTML文件中的a href link
我面临的问题如下所述
modified_contents = re.sub("([^http://*/s]APP[a-z]{2}[0-9]{2})", "<a href=\"http://stack.com=\\1\">\\1</a>", str(soup))
样本输入1:
^{pr2}$样本输入2:
Input File contains <a href="http://stack.com=APPdd34"> APPdd34</a>
Output File contains <a href="http://stack.com=<a href="http://stack.com=APPdd34"> APPdd34</a>"> <a href="http://stack.com=APPdd34"> APPdd34</a></a>
所需的输出文件2与示例输入文件2相同。在
我怎样才能纠正这个问题?在
这可能不能完全回答您的问题,因为我不知道整个输入文件可能是什么样子,但我希望这是您可以采取的一个方向。在
所以基本上,只需使用beauthoulsoup来提取文本,然后就可以从那里构建标记了。在
相关问题 更多 >
编程相关推荐