我有以下数据帧:
index Index_Date A B C D
===========================================
1 2015-01-31 10 10 we 10
2 2015-02-01 2 3 jk 22 and 23 and 24
3 2015-02-02 10 60 nm 280 and 284
4 2015-02-03 10 100 oi 250
5 2015-02-03 10 100 yh Egyptian and Hittite
我想达到
index Index_Date A B C D
===========================================
1 2015-01-31 10 10 we 10
2 2015-02-01 2 3 jk 22
3 2015-02-01 2 3 jk 23
4 2015-02-01 2 3 jk 24
5 2015-02-02 10 60 nm 280
6 2015-02-02 10 60 nm 284
7 2015-02-03 10 100 oi 250
8 2015-02-03 10 100 yh Egyptian
9 2015-02-03 10 100 yh Hittite
基本上,程序需要找到and
语句,如果找到重复的那一行,那么就把before and
部分(22
)留在重复行的第一个after and
部分(23
)和其余部分。你知道吗
我从这个开始,但我不知道我应该去哪里。你知道吗
for row in df:
if df['D'].str.contains(' and ', case=True, na=False, regex=True):
我以前也问过更简单的版本。我也不确定这是太难还是太容易。你知道吗
许多方法来微调这个和它的变化已经被问了很多次。你知道吗
有一种方法:
这里有一个方法
相关问题 更多 >
编程相关推荐