我有一个带列的pandas数据框,我需要清理它,因为数据没有必要的格式:
df = pd.DataFrame({'item': ["1","2","3","4","5","6"], 'store': ["a [note 3]","b [note 98]","c ","a
[note 222]","b","c"]})
print(df)
item store
0 1 a [note 3]
1 2 b [note 98]
2 3 c
3 4 a [note 222]
4 5 b
5 6 c
列'store'
必须按如下方式更改:
item store
0 1 a
1 2 b
2 3 c
3 4 a
4 5 b
5 6 c
按开始的方括号拆分,并在结果列表中拾取第一个索引值
您不需要正则表达式。只需在空格上拆分,然后取第一个字符
如果最终需要正则表达式,可以使用extract
如果括号前有多个字符
相关问题 更多 >
编程相关推荐