import re
result = re.search('font>(.*?)</font', str(scrapped_html))
print(result[1])
这对你的案子有帮助。为了避免捕获标记,您需要操纵字符串。你知道吗
通过print("<br/>" in result[1])检查,如果字符串包含 标记,那么它将返回True,在这种情况下,您需要删除标记。你知道吗
result = str(result[1]).split("<br/>")这会给你一个列表[' Something ', 'else'],加入他们得到你的答案。。result = (" ").join(result)
以下是完整的片段:
import re
result = re.search('font>(.*?)</font', str(scrapped_html))
if "<br/>" in result[1]:
result = str(result[1]).split("<br/>")
result = (" ").join(result)
print(result)
else:
print(result[1])
尝试使用
.text
属性而不是.string
输出:
你可以用正则表达式来处理这些事情!你知道吗
这对你的案子有帮助。为了避免捕获标记,您需要操纵字符串。你知道吗
通过
print("<br/>" in result[1])
检查,如果字符串包含标记,那么它将返回
True
,在这种情况下,您需要删除标记。你知道吗result = str(result[1]).split("<br/>")
这会给你一个列表[' Something ', 'else']
,加入他们得到你的答案。。result = (" ").join(result)
以下是完整的片段:
我知道这是一个相当糟糕的解决方案,但它会为你工作!你知道吗
相关问题 更多 >
编程相关推荐