编辑:到目前为止确定:不是2,而是2之前的字符,十六进制值BF,导致后面字符中的星号(恰好是2)
我正在运行一个使用我编写的python脚本的弹性mapreduce作业,并以意外行的形式得到一些奇怪的输出。不过,我注意到了一种模式。预期的行都有意外的“2”,以字符的形式,在字符的顶部曲线内有小星星。也就是说,当我用Notepad++(而不是Notepad或Word)打开文件时,我看到有两个这样的文件出现(请原谅链接,我不能在10分钟内嵌入图像):
In text: http://i.imgur.com/zaWtC3S.png
Zoomed in: http://i.imgur.com/bTYIlh6.png
当我在自己的机器上运行python脚本时,奇怪的'2'也会出现(尽管意外的行不会出现)。有人知道是什么引起的吗?这也许能让我对我得到的奇怪的额外输出行有所了解。我也很好奇。你知道吗
另外,我认为这可能与编码/解码有关,我正在解析安全的url,但当我去掉那些部分时,奇怪的'2's仍然存在,所以不是那样。你知道吗
谢谢
你有
EF BB BF
在那里。。。这是BOM
标记的UTF-8编码:字节顺序标记。见http://en.wikipedia.org/wiki/Byte_order_mark。我怀疑这封信中的星星是你们编辑的意思,意思是“我刚拿到一张BOM表”。见this earlier question。这似乎是一个众所周知的“事情”,线程有一些建议来处理它。你知道吗相关问题 更多 >
编程相关推荐