对Pandas和python不太熟悉,有一个问题是在整个数据帧中替换多个unicode字符。使用Python2.7并从excel表导入。我的愿望是将所有非ascii字符替换为其等价的ascii字符,或者什么都不替换。在
示例:
u'SHOGUN日语\u2013 GRAND'
u'COMFORT INN&SUITES\Xaostone MOUNTAIN酒店
这是可行的,但很麻烦:
rawdf = rawdf["Account_Name"].str.upper().str.replace(u'\u2013', ' ').str.replace(u'\xa0', '-') + "|" + rawdf["COID"].str.upper()
这不起作用:
^{pr2}$
您可以这样进行编码/解码循环:
^{1}$使用“ignore”可以删除不能用ascii表示的字符。中间表示是字节,所以我们需要再次将其编码回字符串。在
相关问题 更多 >
编程相关推荐