根据特定的过滤条件，在嵌套的for循环中创建多个数据表

for i in range (2007, 2018): for j in range (1,5): dfij_filter = (df['yr'] == i) & (df['Region'] == j) dfij = dfij[dfij_filter] dfij = dfij.join(dfco.groupby('ISSUER_NAME')['E_SCORE'].mean(), on = 'ISSUER_NAME', rsuffix = '_ry') dfij = dfij.join(dfco.groupby('ISSUER_NAME')['P_SCORE'].mean(), on = 'ISSUER_NAME', rsuffix = '_ry') dfij = dfij.join(dfco.groupby('ISSUER_NAME')['Q_SCORE'].mean(), on = 'ISSUER_NAME', rsuffix = '_ry') dfij = dfij.drop_duplicates(subset['ISSUER_NAME'], keep=False) dfij_E = dfij.sort_values('E_SCORE_ry', ascending = False) dfij_ETOP = dfij_E.iloc[:50, :] dfij_P = dfij.sort_values('P_SCORE_ry', ascending = False) dfij_PTOP = dfij_P.iloc[:50, :] dfij_Q = dfij.sort_values('E_SCORE_ry', ascending = False) dfij_QTOP = dfij_Q.iloc[:50, :]

2条回答

网友

1楼 · 编辑于 2024-05-14 09:09:06

您可以使用字典来存储数据帧。这还有一个额外的好处，即启用O（1）查找和分组相关数据。您不需要为此使用嵌套循环，可以将dict+groupby与输入数据帧df一起使用：

dfs = dict(tuple(df.groupby(['yr', 'region']))

这将创建一个字典dfs，将“yr”和“region”的每个组合映射到一个数据帧。您可以通过d[(2010, 1)]访问2010年和区域1的数据帧。在

现在要修改您的数据帧，您可以像任何其他字典一样简单地迭代您的字典：

^{pr2}$

注意，我已经创建了字典ETOP、PTOP、QTOP来存储结果数据帧，每个字典都由相同的('yr', 'region')键结构索引。通过这种方式，您可以轻松地访问、修改或组合任何特定组合的结果。在

网友

2楼 · 编辑于 2024-05-14 09:09:06

for k, v in df.groupby(['yr', 'region']):
    print(v)

相关问题更多 >

编程相关推荐

热门问题

热门文章