Python-如何通过lin读取HTML行

2024-05-16 23:44:21 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图写一个程序,将采取一个HTML文件和输出每一行。我做错了什么,因为我的代码输出每一个字母。如何将所有的HTML行放入一个列表中?

这是目前为止的代码:

f = open("/home/tony/Downloads/page1/test.html", "r")
htmltext = f.read()
f.close()

for t in htmltext:
    print t + "\n"

Tags: 文件代码test程序home列表readdownloads
2条回答

f.read()将尝试读取并生成每个字符,直到满足EOF。你想要的是f.readlines()方法:

with open("/home/tony/Downloads/page1/test.html", "r") as f:
    for line in f.readlines():
        print(line) # The newline is included in line

您可以使用f.readlines(),而不是f.read()。此函数返回文件中所有行的列表。

with open("/home/tony/Downloads/page1/test.html", "r") as f:
    for line in f.readlines():
        print(line)

或者可以使用list(f)

f = open("/home/tony/Downloads/page1/test.html", "r")
f_lines = list(f)
for line in f_lines:
    print(line)

来源:https://docs.python.org/3.5/tutorial/inputoutput.html

相关问题 更多 >