python中的Neested循环

2024-03-28 14:56:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我有两个数据帧,一个有很多行,另一个有几行,我需要根据一些条件(在字符串中)合并这两个数据帧。我在Pandas中使用嵌套循环,如下所示:

density = []

for row in df.itertuples():
    for row1 in df2.itertuples():
        if(row['a'].find(row1['b']))>0:
            density.append(row1['c'])

但我收到错误信息:

TypeError: tuple indices must be integers, not str

怎么了?你知道吗


Tags: 数据字符串inpandasdfforiffind
2条回答

方法数据帧.itertuples返回namedtuple,要访问namedtuple中的值,必须使用点表示法。你知道吗

density = []
for row in df.itertuples():
    for row1 in df2.itertuples():
        if row.a.find(row1.b) > 0:
            density.append(row1.c)

然而,这不会产生两个数据帧的合并。你知道吗

考虑dfdf2

df = pd.DataFrame(dict(
        a=['abcd', 'stk', 'shij', 'dfffedeffj', 'abcdefghijk'],
    ))

df2 = pd.DataFrame(dict(
        b=['abc', 'hij', 'def'],
        c=[1, 2, 3]
    ))

你可以用get_valueset_value产生不错的速度。我将这些值存储在一个数据帧中

density = pd.DataFrame(index=df.index, columns=df2.index)

for i in df.index:
    for j in df2.index:
        a = df.get_value(i, 'a')
        b = df2.get_value(j, 'b')
        if a.find(b) >= 0:
            density.set_value(i, j, df2.get_value(j, 'c'))

print(density)

     0    1    2
0    1  NaN  NaN
1  NaN  NaN  NaN
2  NaN    2  NaN
3  NaN  NaN    3
4    1    2    3

也可以使用复合numpystr函数

t = df2.b.apply(lambda x: df.a.str.contains(x)).values

c = df2.c.values[:, None]

density = pd.DataFrame(
    np.where(t, np.hstack([c] * t.shape[1]), np.nan).T,
    df.index, df2.index)

相关问题 更多 >