Python中的Web抓取从底层表中提取数据 - 问答 - Python中文网

Python中的Web抓取从底层表中提取数据

2024-04-20 08:22:16 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我使用的是python3.4，我试图从下面的链接中删除底层数据并将其转储到.csv文件中。我当前正在使用BeautifulSoup，脚本中的前几行如下所示：

import urllib
from urllib.request import urlopen
from bs4 import BeautifulSoup
htmlfile=urlopen("https://secure.moneygram.com/estimate")
soup=BeautifulSoup(htmlfile)
print (soup.prettify()[0:1000])

谁能帮我一把吗

谢谢

Tags：文件 csv 数据 from import 脚本链接 request

2条回答

网友

1楼 · 编辑于 2024-04-20 08:22:16

你应该看看这个python BeautifulSoup parsing table

然后保存为csv：

data = [...] # your data coming from BS4
import csv
with open('csv_file.csv', 'wb') as csvfile:
    writer = csv.writer(csvfile)
    for row in data
        writer.writerow(row)

网友

2楼 · 编辑于 2024-04-20 08:22:16

如果您需要登录，您将需要使用Splitter（浏览器），如果您不需要它，并且您的数据很清晰，您可以使用find、findNext、findAll、find_name、find_id、find_css从html代码中提取数据。。。示例：

    soop = htmltext.find('table',{"id":"noticeResults"}).findNext('tbody')

此代码为表（tbody）中的数据提供id为“noticeResults”的数据。在

相关问题更多 >

编程相关推荐

热门问题

热门文章