我在一个数据帧中有两个字符串列,我想从a中减去B中的常用词
A -> Stack Overlflow is great
B -> stack great
A-B -> overflow is
我尝试了以下代码。但它只有在B列有一个单词时才起作用。你知道吗
df['A-B'] = [' '.join(set(a.split())-set(b.split())) for a, b in zip(df['A'], df['B'])]
我能做些什么改变吗?这样当B有多个单词时它就可以工作了?你知道吗
Tags:
例如:
>>> df = pd.DataFrame({'A': ['Stack Overlflow is great'], 'B': ['stack great']})
您可以使用
apply
:您可以使用^{} :
您的解决方案就快到了,只需在压缩它们时添加^{} :
如果序列中有重复的字符串,请使用^{} ,这有助于删除重复的字符串
set()
,但也要保持顺序:试试这一行:
只需将这两个列的值都转换成小写并按空格拆分,然后将其放入一个列表中,然后获取一组这些列表并按空格将它们连接起来。你知道吗
相关问题 更多 >
编程相关推荐