同时应用于多行

import http.client, urllib.request, urllib.parse, urllib.error, base64 import pandas as pd import json headers = { # Request headers 'Content-Type': 'application/json', 'Ocp-Apim-Subscription-Key': 'my-api-key-goes-here', } params = urllib.parse.urlencode({ }) df = pd.read_csv('mydata.csv',names=['id','text']) def call_api(row): try: body = { "documents": [ { "language": "en", "id": row['id'], "text": row['text'] } ] } conn = http.client.HTTPSConnection('api-url') conn.request("POST", "api-endpoint" % params, str(body), headers) response = conn.getresponse() data = response.read() data = json.loads(data) return data['documents'][0]['score'] conn.close() except Exception as e: print("[Errno {0}] {1}".format(e.errno, e.strerror)) df['score'] = df.apply(call_api,axis=1)

1条回答

网友

1楼 · 发布于 2024-04-25 20:19:21

DataFrame.apply()很慢；我们可以做得更好。这将一次性创建dict的“文档”列表：

df.to_dict('records')

然后你只需要把它分成100块：

start = 0
while start < len(df):
    documents = df.iloc[start:start+100].to_dict('records')
    call_api(documents)
    start += 100

最后，您可以使用一个带有requests库的HTTP会话：

import requests
session = requests.Session()
call_api(session, documents)

然后在call_api()内部执行session.post(...)。这比每次建立一个新连接更有效。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章