在python中从列中提取单词匹配

2024-05-15 11:05:47 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个数据框,其中一列的形式是

Mat_Headers_Turbine = df_2['1'].unique().tolist()
print(Mat_Headers_Turbine)

['TURBINE , GAS ', 'TURBINE ', 'TURBINE,STEAM ', 'TURBINE, STEAM ', 'TURBINE,EXPANSION ', 'TURBINE STEAM ', 'STEAM TURBINE ', 'TURATING ', 'PUMPS, RECIPROCATING ', 'BLOWERS ', 'REGENERATOR CYLONE SEPERATOR ', 'MOBILE CRANE ', 'MECHANICAL SEAL ', 'TOOLS - MISCELLANEOUS', 'LADDERS ', 'TRANSDUCER ', 'FLAME SCANNERS AND PARTS:', 'VALVE, CONTROL, GLOBE ']

我只需要将对应的值提取到“TURBINE”,即“gas/steam/air/engine/expansion”的新列中。 行数约为50000。我如何才能做到这一点


Tags: 数据df形式steamheadersuniqueprintgas
1条回答
网友
1楼 · 发布于 2024-05-15 11:05:47

您只需要使用以下查询

turbine_values = df_2[(df_2['1'].notnull()) & (df_2['1'].str.contains('TURBINE'))]['1'].apply(lambda turbine_string: turbine_string.split(',')[-1].strip())

这将在所需列上显示包含'TURBINE'的所有行,然后显示相应的值

相关问题 更多 >