熊猫数据框重复

2024-06-16 12:51:22 发布

男 | 程序猿一只，喜欢编程写python代码。

对Pandas和python不太熟悉，有一个问题是在整个数据帧中替换多个unicode字符。使用Python2.7并从excel表导入。我的愿望是将所有非ascii字符替换为其等价的ascii字符，或者什么都不替换。在

示例：
u'SHOGUN日语\u2013 GRAND'
u'COMFORT INN&SUITES\Xaostone MOUNTAIN酒店

这是可行的，但很麻烦：

rawdf = rawdf["Account_Name"].str.upper().str.replace(u'\u2013', ' ').str.replace(u'\xa0', '-') + "|" + rawdf["COID"].str.upper()

这不起作用：

^{pr2}$

Tags：数据示例 pandas ascii unicode 字符 excel upper

1条回答

网友

1楼 · 发布于 2024-06-16 12:51:22

您可以这样进行编码/解码循环：

^{1}$

使用“ignore”可以删除不能用ascii表示的字符。中间表示是字节，所以我们需要再次将其编码回字符串。在