熊猫数据框重复

2024-06-16 12:51:22 发布

您现在位置:Python中文网/ 问答频道 /正文

对Pandas和python不太熟悉,有一个问题是在整个数据帧中替换多个unicode字符。使用Python2.7并从excel表导入。我的愿望是将所有非ascii字符替换为其等价的ascii字符,或者什么都不替换。在

示例:
u'SHOGUN日语\u2013 GRAND'
u'COMFORT INN&SUITES\Xaostone MOUNTAIN酒店

这是可行的,但很麻烦:

rawdf = rawdf["Account_Name"].str.upper().str.replace(u'\u2013', ' ').str.replace(u'\xa0', '-') + "|" + rawdf["COID"].str.upper()

这不起作用:

^{pr2}$

Tags: 数据示例pandasasciiunicode字符excelupper
1条回答
网友
1楼 · 发布于 2024-06-16 12:51:22

您可以这样进行编码/解码循环:

^{1}$

使用“ignore”可以删除不能用ascii表示的字符。中间表示是字节,所以我们需要再次将其编码回字符串。在

相关问题 更多 >