仅使用python的内置功能从本地磁盘读取和打印html

2024-05-23 18:05:59 发布

您现在位置:Python中文网/ 问答频道 /正文

我找了又找,但已经到了死胡同我的正常政策是尝试寻找,只有当我碰到墙问问题,我正在学习python的学校,我有一个作业,我需要完成,但我不明白为什么现在我不要求任何人做我的家庭工作,但也许有人可以解释什么编码我失踪或不明白是什么意思

我拿了一个本地保存的html文件,我正试图让python读取它,并显示和打印在python外壳中的文本,只有在它的外观,如果你打开了txtpad的html文件,但它必须只使用的工具和python标准的库任何帮助,可以提供我会非常感谢

这是我的密码

    Import re
    html = open("index.html").read()
    text = re.sub("<.*?>", "\n", html)
    print(text)

所以这使得文本看起来像这样

    "title


     body

     body

     body

     body


     end"

我希望它看起来像这样

    "title
     body
     body
     body
     body
     end"

但是如果我删除“\n”它看起来像

    "title      body     body     body
     body      end"

所以这就是我被困住的原因


Tags: 文件text文本re编码titlehtml家庭