从dataframe创建BigQuery表，而不显式指定模式

from google.cloud import bigquery as bq client = bq.Client() dataset_ref = client.dataset('my_dataset', project = 'my_project') table_ref = dataset_ref.table('my_table') job_config = bq.LoadJobConfig( schema=[ bq.SchemaField("a", bq.enums.SqlTypeNames.STRING), bq.SchemaField("b", bq.enums.SqlTypeNames.INT64), bq.SchemaField("c", bq.enums.SqlTypeNames.FLOAT64), ] ) client.load_table_from_dataframe(my_df, table_ref, job_config=job_config).result()

2条回答

网友

1楼 · 编辑于 2024-05-15 01:07:05

下面是将数据帧加载到BQ的代码片段：

import pandas as pd
from google.cloud import bigquery

# Example data
df = pd.DataFrame({'a': [1,2,4], 'b': ['123', '456', '000']})

# Load client
client = bigquery.Client(project='your-project-id')

# Define table name, in format dataset.table_name
table = 'your-dataset.your-table'

# Load data to BQ
job = client.load_table_from_dataframe(df, table)

如果您只想指定模式的一个子集，但仍要导入所有列，则可以使用

# Define a job config object, with a subset of the schema
job_config = bigquery.LoadJobConfig(schema=[bigquery.SchemaField('b', 'STRING')])

# Load data to BQ
job = client.load_table_from_dataframe(df, table, job_config=job_config)

网友

2楼 · 编辑于 2024-05-15 01:07:05

以下是工作代码：

from google.cloud import bigquery
import pandas as pd

bigqueryClient = bigquery.Client()
tableRef = bigqueryClient.dataset("dataset-name").table("table-name")

dataFrame = pd.read_csv("file-name")

bigqueryJob = bigqueryClient.load_table_from_dataframe(dataFrame, tableRef)
bigqueryJob.result()

相关问题更多 >

编程相关推荐

热门问题

热门文章