如何删除以开头并包含特殊字符Pandas的字符串

2024-06-16 09:26:11 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个包含文本的列的数据帧。此数据来自并保存到csv文件中,包含以下字符串:

 Supporter🇨🇮
 🇮🇪🇪🇺
 📞061 300149 💻sdim.csdg@dsga.com

可以从文本数据中删除这些字符串吗?如果是这样,最好的方法是什么?在

我试过:

^{pr2}$

但不幸的是,它并没有消除弦。在

谢谢!在


Tags: 文件csv数据方法字符串文本compr2
2条回答

您可以尝试这里描述的方法:Replace non-ASCII characters with a single space

不是用space替换,而是传递空字符串''来删除字符。在

例如以下数据帧

                Supporter
0                🇨🇮
1                     foo
2        🇮🇪🇪🇺
3          üìû061 300149
4                     bar
5  💻sdim.csdg@dsga.com

我们可以使用^{}删除任何包含特殊字符的行:

^{pr2}$

输出:

  Supporter
1       foo
4       bar

另外,如果要在保留实际记录的同时只删除特殊字符:

df['Supporter'] = df['Supporter'].str.replace('[\u0080-\uFFFF]', '')

print(df)

输出:

    Supporter
0            
1         foo
2            
3  061 300149
4         bar

注意:如果数据集中有任何NA值,则应在运行这些值之前删除它们:

df = df.dropna()

相关问题 更多 >