googlebigquery从Python脚本执行SQL文件

2024-04-25 01:35:59 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个python文件,它使用datalab.bigquery执行已写出的SQL查询。但是,我将这个SQL查询保存在同一个GitHub存储库中,因此我想知道是否有一种方法可以在不复制和粘贴查询的情况下运行GitHub SQL文件。在

目前是这样的:

import datalab
import datalab.bigquery as bq
import pandas as pd 

df = bq.Query('''
                SELECT
                  CASE
                    WHEN advance_date IS NULL
                        AND release_date IS NULL
                        AND resale_close_date IS NULL
                            THEN TRUE
 ...
 '''_.to_dataframe()

这很好,但是当对SQL脚本进行更新时,它们不会反映在这个python脚本中,这就产生了一个问题。我希望它调用保存在Github存储库中的SQL查询。有办法吗?比如df=bq.执行(sql语言_文件.sql).to_dataframe()。在


Tags: and文件toimportgithubdataframedfsql
1条回答
网友
1楼 · 发布于 2024-04-25 01:35:59

您可以使用包含SQL脚本的Github代码段的“原始”页面,然后检查该页面以获取脚本。在

例如,假设我想要这个脚本[1](在您的例子中是SQL脚本),我单击“RAW”按钮并保存URL。然后,您可以使用requests在Python中查看该URL的内容:

import requests

raw=<URL OF YOUR SQL SCRIPT>
#In my case it would be
#raw="https://raw.githubusercontent.com/GoogleCloudPlatform/python-docs-samples/master/appengine/standard/bigquery/main.py"
r=requests.get(raw).text
df=bq.Query(r).to_dataframe()

如果你没听错,我想怎么办

相关问题 更多 >