trainLabels = files.upload()
labels = (trainLabels['LabelsTrain.txt']).splitlines()
trainLabels = [k.encode("utf-8") for k in labels]
我正在用谷歌酷宝来训练一个网络。我从文本文件中读取图像标签,它们似乎被编码了。
标签显示为:
^{pr2}$
所以我试图使用^{{cd2>}来删除^{cd1>}。
但是,我得到以下错误:
^{pr3}$
我如何解决这个错误?
Tags:
当您读取文件时,字符串仍然是以
utf
或ascii
编码的字节类型。在在python中,
encode
生成byte type
的字符串,并且您的数据已经是b
(字节类型)。在因此,在python中,
byte
不可能再次编码为Unicode byte
。它犯了这个错误。在在python解释器中它看起来是可读的(它只是显示给人看的),但是实际数据是以Unicode字节格式编码的。
因此,在python解释器中使用
decode
将bytestrem转换为Unicode文本,而不使用b
的句柄文本因此,将
encode
更改为decode
会很好地工作。在相关问题 更多 >
编程相关推荐