Python中的Google表查询

2024-04-25 09:43:12 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个Google工作表,它使用=IMPORTXML函数从网站获取数据。我还有一个Python脚本,它从googlesheet获取数据。整件事都在工作,但我现在正在努力简化它。这一切都是从googlesheets的手工操作开始的。现在已经自动化了,但不漂亮。在

两个具体问题:

1)使用Python抓取网站的最佳方法是什么?我想在一个脚本中运行这一切。像Beautiful Soup这样的方法是一个好的解决方案吗?在

2)目前googleapi的查询被编码为单独运行每个查询(它不是一个子函数,但我想把它变成一个子函数)。它实际上复制了quickstart script

spreadsheetId = 'xxxx'
rangeName = 'xxxx'
result = service.spreadsheets().values().get(spreadsheetId=spreadsheetId,range=rangeName).execute()
values = result.get('values', [])
variable = ''
for row in values:
    variable = '%s' % (row[0])
if variable != storedVariable:
    print ('Condition not met...')
    return;
#Do a thing

我的代码有各种版本的设置变量、对照存储值检查变量以及在存在正确条件时继续执行。有没有更简单的方法来解析API调用返回的值,以便将其设置为变量?在


Tags: 方法函数脚本get网站googleresultvariable
1条回答
网友
1楼 · 发布于 2024-04-25 09:43:12
  1. 只要页面是完全静态的,beauthulsoup就可以很好地抓取数据。对于大多数网页,你需要能够与网页互动,以获得你需要的数据或迭代多个网页。硒对这些情况很好。在
  2. 这个问题我没有更好的解决办法。googleapi python客户端库很麻烦。看起来gspread曾经是一个很好的替代品,拥有更多的功能,但是它已经有将近一年没有更新了,似乎已经落后于google库。在

相关问题 更多 >