我想使用pandas将我的刮取数据保存到csv文件。但我一直有一只虫子
这是我的密码:
import requests
from bs4 import BeautifulSoup
import pandas as pd
link = ("https://sofifa.com/team/1/arsenal/?&showCol%5B%5D=ae&showCol%5B%5D=hi&showCol%5B%5D=le&showCol%5B%5D=vl&showCol%5B%5D=wg&showCol%5B%5D=rc")
get_text = requests.get(link)
soup = BeautifulSoup(get_text.content, "lxml")
table = soup.find("table", {"class":"table table-hover persist-area"})
table1 = table.get_text()
table1.to_csv("Arsenal_players.csv")
你需要输入更多的解释,然后再问一个问题,比如你得到的错误类型。这将更有助于给出答案。不管怎样,我运行了你的代码,看到了预期的错误。 表1变量现在只包含字符串,因为
因此,在您的情况下,没有函数可以在csv中输入所有数据,但您可以找到帮助here。 但请记住,下一次要对你的问题保持精确
您需要首先使用read_html将html读入数据帧,然后使用
to_csv
写入文件。以下是一个例子:read_html
方法有很多选项可以改变行为。您还可以使用它直接读取链接,而不是首先使用requests/BeautifulSoup(它可以在引擎盖下执行此操作)它可能看起来像这样,但这是未经测试的,因为当我这样做时,该链接给出一个403禁止(可能他们是基于用户代理进行阻止):
编辑:由于read_html不允许您指定用户代理,我相信这将是此特定链接最简洁的方式:
相关问题 更多 >
编程相关推荐