Python数据帧：包含“”的简单字符串拆分

input: buzz_id facet facet_cls facet_val p_buzz_date 0 95713207 A3 Small MN 20160101 1 95713207 S3 Small-box Tbd 20160101 2 95713207 F1 Medium es 20160101 3 95713207 A2 Medium-box esf 20160101 4 95713207 A1 Dum-pal ess 20160101 ... output: buzz_id facet facet_cls facet_val p_buzz_date 0 95713207 A3 Small MN 20160101 1 95713207 S3 Small Tbd 20160101 2 95713207 F1 Medium es 20160101 3 95713207 A2 Medium esf 20160101 4 95713207 A1 Dum ess 20160101 ...

2条回答

网友

1楼 · 编辑于 2024-05-14 18:08:07

使用^{}，然后按str[0]只选择列表的第一个值：

df['facet_cls'] = df['facet_cls'].str.split('-').str[0]
print (df)
    buzz_id facet facet_cls facet_val  p_buzz_date
0  95713207    A3     Small        MN     20160101
1  95713207    S3     Small       Tbd     20160101
2  95713207    F1    Medium        es     20160101
3  95713207    A2    Medium       esf     20160101
4  95713207    A1       Dum       ess     20160101

细节：

print (df['facet_cls'].str.split('-'))
0          [Small]
1     [Small, box]
2         [Medium]
3    [Medium, box]
4       [Dum, pal]
Name: facet_cls, dtype: object

网友

2楼 · 编辑于 2024-05-14 18:08:07

也可以使用lambda表达式执行此操作，如下所示：

df['facet_cls'] = df['facet_cls'].apply(lambda x:x.split('-')[0])

相关问题更多 >

编程相关推荐

热门问题

热门文章