根据上一行添加新行

index Index_Date A B C D =========================================== 1 2015-01-31 10 10 we 10 2 2015-02-01 2 3 jk 22 and 23 and 24 3 2015-02-02 10 60 nm 280 and 284 4 2015-02-03 10 100 oi 250 5 2015-02-03 10 100 yh Egyptian and Hittite

index Index_Date A B C D =========================================== 1 2015-01-31 10 10 we 10 2 2015-02-01 2 3 jk 22 3 2015-02-01 2 3 jk 23 4 2015-02-01 2 3 jk 24 5 2015-02-02 10 60 nm 280 6 2015-02-02 10 60 nm 284 7 2015-02-03 10 100 oi 250 8 2015-02-03 10 100 yh Egyptian 9 2015-02-03 10 100 yh Hittite

3条回答

网友

1楼 · 编辑于 2024-05-12 21:07:39

许多方法来微调这个和它的变化已经被问了很多次。你知道吗

D = df.D.astype(str).str.split(' and ')
idx = df.index.repeat(D.str.len())
df.loc[idx].assign(D=np.concatenate(D).astype(int))

   Index_Date   A    B   C    D
0  2015-01-31  10   10  we   10
1  2015-02-01   2    3  jk   22
1  2015-02-01   2    3  jk   23
1  2015-02-01   2    3  jk   24
2  2015-02-02  10   60  nm  280
3  2015-02-03  10  100  oi  250

网友

2楼 · 编辑于 2024-05-12 21:07:39

有一种方法：

import pandas as pd

df = pd.DataFrame([['2015-01-31', 10, 10, 'we', 10],
                   ['2015-02-01', 2, 3, 'jk', '22 and 23 and 24'],
                   ['2015-02-02', 10, 60, 'nm', 280],
                   ['2015-02-03', 10, 100, 'oi', 250]],
                  columns=['Index_Date', 'A', 'B', 'C', 'D'])

df.loc[df.D.astype(str).str.contains('and').fillna(False), 'D'] = df.D.str.split('and')

res = df.set_index(['Index_Date', 'A', 'B', 'C'])['D'].apply(pd.Series).stack().reset_index()
res = res.rename(columns={0: 'D'})
res.D = res.D.astype(int)
res = res[['Index_Date', 'A', 'B', 'C', 'D']]

#    Index_Date   A    B   C    D
# 0  2015-01-31  10   10  we   10
# 1  2015-02-01   2    3  jk   22
# 2  2015-02-01   2    3  jk   23
# 3  2015-02-01   2    3  jk   24
# 4  2015-02-02  10   60  nm  280
# 5  2015-02-03  10  100  oi  250

网友

3楼 · 编辑于 2024-05-12 21:07:39

这里有一个方法

df = pd.read_clipboard(sep = '\s\s+')

Index_Date    A    B    C    D
2015-01-31    10   10   we  10
2015-02-01     2    3   jk  22 and 23 and 24 
2015-02-02    10   60   nm  280
2015-02-03    10  100   oi  250


df.set_index(['Index_Date', 'A', 'B', 'C']).D.str.split('and', expand = True)\
.stack().reset_index(4,drop = True).reset_index(name = 'D')

    Index_Date  A   B   C   D
0   2015-01-31  10  10  we  10
1   2015-02-01  2   3   jk  22
2   2015-02-01  2   3   jk  23
3   2015-02-01  2   3   jk  24
4   2015-02-02  10  60  nm  280
5   2015-02-03  10  100 oi  250

相关问题更多 >

编程相关推荐

热门问题

热门文章