Pandas系列的麻烦。尝试使用Regex剥离或替换

df['reports'].str.lstrip('url') #this didn't work, even just to remove the 'url' part df['reports'].replace({'[{}]'}regex=True,inplace=True,to_replace=r'\[\{\'\w{3}',value=r' df['reports'].replace(regex=True,inplace=True,to_replace=r'\[\{\'url\'',value=r'') df['reports'] = df['reports'].map(lambda x: x.lstrip('\[{\'url\': \'').rstrip('\'}]\''))

In: df['reports'] Out: *reports* http://208.xx.xx.19/uploads/media/default/0001/02/e633f1.pdf http://208.xx.xx.19/uploads/media/default/0001/02/exyz2.pdf http://208.xx.xx.19/uploads/media/default/0001/02/e633342.pdf http://208.xx.xx.19/uploads/media/default/0001/02/ashj39.pdf http://208.xx.xx.19/uploads/media/default/0001/02/asdji34q2.pdf Name: reports, Length: 155, dtype: object

1条回答

网友

1楼 · 发布于 2024-06-08 19:05:01

你在找这样的东西吗

df['reports'].str.replace("^\[{'url': ","").str.replace("}\]$","")

第一个“str.replace”在开头查找模式“[{'url'：”，第二个在结尾查找模式“}]”

编辑：因为序列条目实际上是一个字典列表，所以解决方案是：

df['reports'].apply(lambda x:x[0]['url'])

相关问题更多 >

编程相关推荐

热门问题

热门文章