使用python在html文件中查找body标记的结尾

2024-03-28 23:49:39 发布

您现在位置:Python中文网/ 问答频道 /正文

嗨,我有以下代码

inex = "app/index.html" 
original = open(index,"r")
for line in original:
    if line =='</body>':
        print "here"
original.close()

但似乎找不到底线。即使索引.html文件没有?有没有找到标签的线索?
谢谢


Tags: 代码inappforcloseindexifhere
2条回答

或者您可以尝试:

if '</body>' in line:

现在您要求该行正好是"</body>",没有空格。另外,有效的HTML在正文之前可以有其他内容,因为HTML只是将行尾视为空白,即可以有foo</body>

解决问题最直接的方法是将文件内容读入字符串,然后在该字符串上调用find

allText = original.read()
location = allText.find("</body>")

还有许多HTML解析器可以为您完成这项工作。你知道吗

相关问题 更多 >