基于多个字符串拆分列

2024-04-26 21:35:43 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试用熊猫的文本拆分一列。你知道吗

此列包含单词“Alpha”、“Beta”。 我需要把这一列拆分为这些单词之后,这些单词和之前的所有内容都需要放在一列中,后面的所有内容都需要放在一个新的列中。你知道吗

我试过这个:

split_df = df.str.split('ALPHA ').apply(pd.Series)

但在阿尔法之前我失去了一切


Tags: 文本alpha内容df单词betaseriespd
1条回答
网友
1楼 · 发布于 2024-04-26 21:35:43

IIUC您可以^{}通过regex r'Alpha|Beta'-它意味着AlphaBeta

print df
             text
0   aaa Alpha bbb
1   ddd Alpha ccc
2    uuu Beta vvv

split_df = df['text'].str.split(r'Alpha|Beta').apply(pd.Series)
split_df.columns = ['before','after']
print split_df
  before  after
0   aaa     bbb
1   ddd     ccc
2   uuu     vvv

相关问题 更多 >