如何提取我们使用url.open（）从网站获取的部分数据

2条回答

网友

1楼 · 编辑于 2024-06-16 10:00:55

url = 'http://mbox.dr-chuck.net/sakai.devel/1/2'
data = urllib.urlopen(url).readlines()
for line in data:
    if line.startswith('From'):
        print (line)

输出：

From news@gmane.org Tue Mar 04 03:33:20 2003

From: "Glenn R. Golden" <ggolden@umich.edu>

使用readlines()获取文件中的每一行

使用startswith()获取以From开头的行

网友

2楼 · 编辑于 2024-06-16 10:00:55

如果您使用的是python3，则可以执行以下操作：

from urllib.request import urlopen

data = urlopen("http://mbox.dr-chuck.net/sakai.devel/1/2").read().decode("utf8").split("\n")

for k in data:
    print(k)

更新：

如果只想打印给定url的第二行，可以执行以下操作：

print(data[1])
>>> 'From: "Glenn R. Golden" <ggolden@umich.edu>'

否则，如果要打印以From或From:开头的所有行，可以执行以下操作：

for k in data:
    if k.split(" ")[0] == "From" or k.split(" ")[0] == "From:":
        print(k)

输出：

From news@gmane.org Tue Mar 04 03:33:20 200
From: "Glenn R. Golden" <ggolden@umich.edu>

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何提取我们使用url.open（）从网站获取的部分数据

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >