我有一个如下的数据帧-
carrier_plan_identifier ... hios_issuer_identifier
1 AUSK ... 99806.0
2 AUSM ... 99806.0
3 AUSN ... 99806.0
4 AUSS ... 99806.0
5 AUST ... 99806.0
我需要选择一个特定的列,比如说wellthie_issuer_identifier
。你知道吗
我需要基于此列值查询数据库。我的select查询将类似于。你知道吗
select id, wellthie_issuer_identifier from issuers where wellthie_issuer_identifier in(....)
我需要将id
列添加回与wellthie_issuer_identifier
相关的现有数据帧。你知道吗
我已经搜索了很多,但不清楚如何才能做到这一点。你知道吗
试试这个:
1.)选择一个特定的列,比如说
wellthie_issuer_identifier
t = tuple(df.wellthie_issuer_identifier)
这会给你一个tuple
式的(1,0,1,1)2.)根据此列值查询数据库
您需要在查询中替换上述元组:
创建一个指向数据库的游标,执行这个查询并创建结果的数据帧。你知道吗
现在您的
df_new
将有id, wellthie_issuer_identifier
列。您需要将这个id
列添加回现有的df。你知道吗请执行以下操作:
df = pd.merge(df,df_new, on='wellthie_issuer_identifier',how='left')
它将向
df
添加一个id
列,如果在wellthie_issuer_identifier
上找到匹配项,该列将有值,否则它将放入NaN
。你知道吗如果这有帮助,请告诉我。你知道吗
这将不接受
wellthie_issuer_identifier
的值,但正如您所说的,它将是它们的所有值,那么下面应该适合您:如果列不太长,可以使用pandas将另一列添加到数据帧,例如:
然后您可以继续查询您的数据库
相关问题 更多 >
编程相关推荐