2024-06-16 09:26:11 发布
网友
我有一个包含文本的列的数据帧。此数据来自并保存到csv文件中,包含以下字符串:
Supporterüá®üáÆ üáÆüá™üá™üá∫ üìû061 300149 üíªsdim.csdg@dsga.com
可以从文本数据中删除这些字符串吗?如果是这样,最好的方法是什么?在
我试过:
但不幸的是,它并没有消除弦。在
谢谢!在
您可以尝试这里描述的方法:Replace non-ASCII characters with a single space
不是用space替换,而是传递空字符串''来删除字符。在
space
''
例如以下数据帧
Supporter 0 üá®üáÆ 1 foo 2 üáÆüá™üá™üá∫ 3 üìû061 300149 4 bar 5 üíªsdim.csdg@dsga.com
我们可以使用^{}删除任何包含特殊字符的行:
输出:
Supporter 1 foo 4 bar
另外,如果要在保留实际记录的同时只删除特殊字符:
df['Supporter'] = df['Supporter'].str.replace('[\u0080-\uFFFF]', '') print(df)
Supporter 0 1 foo 2 3 061 300149 4 bar
注意:如果数据集中有任何NA值,则应在运行这些值之前删除它们:
NA
df = df.dropna()
您可以尝试这里描述的方法:Replace non-ASCII characters with a single space
不是用
space
替换,而是传递空字符串''
来删除字符。在例如以下数据帧
我们可以使用^{} 删除任何包含特殊字符的行:
^{pr2}$输出:
另外,如果要在保留实际记录的同时只删除特殊字符:
输出:
注意:如果数据集中有任何
NA
值,则应在运行这些值之前删除它们:相关问题 更多 >
编程相关推荐