比较两个独立数据帧中的数据并在Python/Pandas中生成结果

for i_symbol, acceptance_date in transactions.itertuples(index=False): for symbol, date in market.itertuples(index=False): if i_symbol == symbol and acceptance_date == date: print(market.symbol + market.date + market.close)

2条回答

网友

1楼 · 编辑于 2024-05-26 07:46:33

@Parfait在下面提供了最佳答案作为评论。非常干净，速度非常快-谢谢。你知道吗

 pd.merge(market[['symbol', 'date', 'close']], transactions[['i_symbol',
 'acceptance_date']], left_on=['symbol', 'date'], right_on=['i_symbol',
 'acceptance_date']).

不需要循环。你知道吗

网友

2楼 · 编辑于 2024-05-26 07:46:33

关于问题1:熊猫.itertuples（）为每行生成一个^{}。您可以像标准元组一样解压缩这些元素，也可以按名称访问元组元素：

for t in transactions.itertuples(index=False):
  for m in market.itertuples(index=False):
    if t.i_symbol == m.symbol and t.acceptance_date == m.date:
        print(m.symbol + m.date + m.close)

（我没有用你这种大小的数据帧测试这个，但我很确定它仍然非常慢）

关于问题2：您可以简单地^{}符号和日期上的数据帧。你知道吗

重命名“transactions”数据框，使其也包含名为“symbol”和“date”的列：

transactions = transactions[['i_symbol', 'acceptance_date']]
transactions.columns = ['symbol','date']

然后合并符号和日期上的两个数据帧：

result = pd.merge(market, transactions, on=['symbol','date'])

结果数据帧由两个数据帧中存在的每个符号/日期组合的一行组成。操作只需要几秒钟在我的机器上与你的大小的数据帧。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章