Python3编码和解码issu

2024-06-02 07:36:27 发布

您现在位置:Python中文网/ 问答频道 /正文

我是韩国人,在我的大学网站上制作网页抓取程序,其中包含韩语内容
但是,当我删除这个站点中表的一些内容时,结果如下:

16/01/27  (2.16 ¸¶°¨)2016Çг⵵ 1Çбâ ÀÌÈ­¿©´ë ´ëÇпø ...
16/01/27  (1.29 ¸¶°¨)2016Çг⵵ 1Çбâ ÀÌÈ­¿©´ë(ÇкÎ) ÇÐ...
16/01/27  [º¸°ÇÁø·á¼Ò] Áø·á½Ã°£ ´ÜÃà ¾Ë¸²
16/01/26  2016Çг⵵ 1Çб⠱³³» ±Ù·ÎÀåÇÐ ½Åû ¾È³»
16/01/26  [½ºÆ®·¹½ºÅ¬¸®´Ð] 16³â 2¿ù ¸í»óÇÁ·Î±×·¥ Âü°¡ÀÚ...
16/01/26  [¿µ¾î°­ÀÇ ¼ö°­ Àü·«] ¿µ¾î ÇÁ·¹Á¨Å×À̼Ç,¿µ¾î ...
16/01/26  ¼­¿ï´ëÇб³ Àü±â¡¤µµ½Ã°¡½º ¿¡³ÊÁö »ç¿ëÁ¤º¸ ¾È...
16/01/26  (2.3 ¸¶°¨)2016Çг⵵ 1Çб⠰øÁÖ´ë ÇÐÁ¡±³·ù ¾È...
16/01/26  (2.3 ¸¶°¨)2016Çг⵵ 1Çб⠾ÆÁÖ´ë ´ëÇпø ÇÐÁ¡...
16/01/26  (1.29 ¸¶°¨)2016Çг⵵ 1Çб⠾ÆÁÖ´ë(ÇкÎ) ÇÐÁ¡...
16/01/25  [½Åû] 2015 µ¿°è SNUìÑ Ãë¾÷Ä·ÇÁ
16/01/25  µ¿°è¹æÇÐ ¼ÅƲ¹ö½º ¿îÇàÇöȲ
16/01/25  2016. 1Çб⠴ëÇпµ¾î1, ´ëÇпµ¾î2 ´ã´ç±³¼ö º¯...

它看起来像是一种外星语言。当我打印这些外来句子的type时,所有的句子都是type 'str'
据我所知,python3的默认编码是unicode,所以我不必像在python2中那样使用encode()或{}函数。
我不知道为什么会这样 我真的想让你知道网站的网址,但这个网页只能由授权用户访问。
我需要你的建议,谢谢。在

只有这一页是这样显示的。当我放弃其他韩国网站时,这并没有发生。在


Tags: 程序语言网页内容编码站点网站type