Pandas数据帧过滤| |只保留列的连续元素

import pandas as pd df = pd.DataFrame({'a': [201, 201, 201, 201, 202, 202, 202, 203, 203, 203], 'b': [ 1, 2, 3, 5, 1, 2, 6, 1, 3, 4]}) df_filter = pd.DataFrame({'a': [ 201, 202, 203], 'b': [[1, 2, 3], [1, 2], [1]]}).set_index('a')

>>> df a b 0 201 1 1 201 2 2 201 3 3 201 5 4 202 1 5 202 2 6 202 6 7 203 1 8 203 3 9 203 4 >>> >>> df_filter b a 201 [1, 2, 3] 202 [1, 2] 203 [1]

1条回答

网友

1楼 · 发布于 2024-04-19 00:11:06

pandas0.25+的解决方案-通过^{}将列表转换为行，然后通过默认的内部联接merge（列名相同，因此on参数是省略的）：

df = df_filter['b'].explode().reset_index().merge(df)
print (df)
     a  b
0  201  1
1  201  2
2  201  3
3  202  1
4  202  2
5  203  1

或者^{}如果输入是2列DataFrame：

df_filter = pd.DataFrame({'a': [      201,    202, 203],
                       'b': [[1, 2, 3], [1, 2], [1]]})

df = df_filter.explode('b').merge(df)
print (df)
     a  b
0  201  1
1  201  2
2  201  3
3  202  1
4  202  2
5  203  1

编辑：要避免重置为默认索引值，请使用reset_index和set_index：

df = df_filter.explode('b').merge(df.reset_index()).set_index('index')
print (df)
         a  b
index        
0      201  1
1      201  2
2      201  3
4      202  1
5      202  2
7      203  1

相关问题更多 >

编程相关推荐

热门问题

热门文章