python的请求显示奇怪的语言而不是阿拉伯语

2024-04-25 17:51:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在制作一个python脚本,我希望它从站点获取一个Arabin文本,但是当我使用请求获取文本时,我得到的只是:

æóæÇÌóÒóÚÇð áóæ ßÇäó áöáäóÝÓö ãóÌÒóÚõ

而不是这样:

اذا ما مَشَت نادى بما في ثِيابها ذكِيُّ الشذا والمَندَليّ المطَيَّرُ

我尝试了同样的代码在不同的网站,也使用阿拉伯语,代码工作得很完美,抓住了阿拉伯语文本没有任何问题

from bs4 import BeautifulSoup
import requests

a = requests.get("https://www.aldiwan.net/poem30.html")
a = a.text


Tags: 代码fromhttps文本import脚本get站点
1条回答
网友
1楼 · 发布于 2024-04-25 17:51:20

你必须解码内容而不是文本

我试着用utf-8解码,但一直失败,所以我转到url,他们使用的是一种特定类型的字符集,即windows-1256。你知道吗

enter image description here

我用同样的东西来解码内容,瞧!你知道吗

enter image description here

相关问题 更多 >