在python的嵌套for循环中合并数据帧

for d in tradedays: for f in factor_list: file_name='/home/jovyan/multifactor_data/'+str(f)+'/'+str(d)+'.csv' if os.path.exists(file_name) and 20160929<=int(d)<=20160930: origin_df=pd.read_csv(file_name) origin_df=origin_df.loc[:,['symbol','indusMkt1']] df_list.append(origin_df) else: pass

1条回答

网友

1楼 · 发布于 2024-04-18 00:42:58

考虑在每个循环中重置df_list，并使用reduce(lambda ...)合并列表中的所有数据帧。并考虑使用以tradedays为键的字典来避免全局环境中的许多日常数据帧：

from functools import reduce
import pandas as pd
import os 

dfs = {}                                                  # MERGED DFs DICT
for d in tradedays:
    df_list = []                                          # RESET DF LIST BY DAY
    for f in factor_list:                    
        file_name = os.path.join('/home/jovyan/multifactor_data',str(f),str(d)+'.csv')
        if os.path.exists(file_name) and 20160929 <= int(d) <= 20160930:
            df_list.append(pd.read_csv(file_name)[['symbol','indusMkt1']])

    dfs[d] = reduce(lambda left,right: pd.merge(left, right, on=['symbol']), df_list)

相关问题更多 >

编程相关推荐

热门问题

热门文章

在python的嵌套for循环中合并数据帧

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >