Sqlalchemy：将pandas dataframe中的新行添加到mysql表中，如果选项卡中不存在这些新行

import requests import json from pandas.io.json import json_normalize myToken = 'xxx' myUrl = 'somewebsite' head = {'Authorization': 'token {}'.format(myToken)} response = requests.get(myUrl, headers=head) data=response.json() #print(data.dumps(data, indent=4, sort_keys=True)) results=json_normalize(data['results']) results.rename(columns={'datastream.name': 'datastream_name', 'datastream.url':'datastream_url', 'datastream.datastream_type_id':'datastream_id', 'start':'error_date'}, inplace=True) results_final=pd.DataFrame([results.datastream_name, results.datastream_url, results.error_date, results.datastream_id, results.message, results.type_label]).transpose() from sqlalchemy import create_engine from sqlalchemy import exc engine = create_engine('mysql://usr:psw@ip/schema') con = engine.connect() results_final.to_sql(name='error',con=con,if_exists='replace') con.close()

1条回答

网友

1楼 · 发布于 2024-04-26 06:22:13

您可以将数据库中已经存在的结果拉到一个新的数据帧中，然后比较这两个数据帧。之后，只插入不在表中的行。不知道表或数据的格式，我只是在这里使用一个通用的SELECT语句。在

from sqlalchemy import create_engine
from sqlalchemy import exc
engine = create_engine('mysql://usr:psw@ip/schema')
con = engine.connect()
sql = "SELECT * FROM table_name"
old_results = pd.from_sql(sql, con)
df = pd.merge(old_results, results_final, how='outer', indicator=True)
new_results = df[df['_merge']=='right_only'][results_final.columns]
new_results.to_sql(name='error',con=con,if_exists='append')
con.close()

您还需要将if_exists更改为append，因为设置为replace会删除表中的所有值，并用pandas数据帧中的值替换它们。在

相关问题更多 >

编程相关推荐

热门问题

热门文章