解码shift jis：“非法多字节序列”

2条回答

网友

1楼 · 编辑于 2024-05-14 07:48:04

Shift_JISx0213在真实世界中不使用。它只是用来展示自己，伊姆霍。Windows无法处理它。字符集JIS X 0213在大多数情况下与Unicode一起使用，但不是Shift-JIS。

使用'cp932'（在Python 3中）。

/sjis.txt包含

5c  7e  87  52  87  53  87  54  87  8a  fa  b1  fb  50  fb  fc

（它们保存在Windows 10上）

>>> import codecs
>>> codecs.open('sjis.txt',"rb",'shift_jis').read()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/codecs.py", line 700, in read
    return self.reader.read(size)
UnicodeDecodeError: 'shift_jis' codec can't decode byte 0x87 in position 2: illegal multibyte sequence
>>> codecs.open('sjis.txt',"rb",'shift_jisx0213').read()
'¥‾⑲⑳Ⅰ㈱郫鍚騠'
>>> codecs.open('sjis.txt',"rb",'cp932').read()
'\\~⑲⑳Ⅰ㈱﨑瀨髙'

符号和最后三个汉字解释不同。

网友

2楼 · 编辑于 2024-05-14 07:48:04

存在多个版本的Shift-JIS。shift_jis编解码器是JIS X 0208，而该表是JIS X 0213，对应于shift_jisx0213编解码器。

>>> u'⑲⑳Ⅰ'.encode('shift_jisx0213')
'\x87R\x87S\x87T'

相关问题更多 >

编程相关推荐

热门问题

热门文章

解码shift jis：“非法多字节序列”

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >