Python: 在网站源代码中查找字符串的问题

0 投票
2 回答
956 浏览
提问于 2025-04-15 22:24

我用urlopen打开了一个网站。然后我把这个网站的源代码放进一个变量里,像这样:

source = website.read()

当我直接打印这个源代码时,它的格式看起来是正确的,但当我尝试逐行读取时,每个字符却变成了单独的一行。

比如说,直接打印出来的样子是这样的:

<HTML> title</html>

但是当我这样做:

for line in source:
      print line

它的样子就变成了这样:

<
H
T
M
L
... etc

我需要找到一个以"var"开头的字符串,然后打印出整行内容。

2 个回答

1

或者使用:

for line in source.split("\n"):
    ...
5

用readlines()来代替read(),这样可以得到一个包含每一行的列表。

撰写回答