我正在制作一个python脚本,我希望它从站点获取一个Arabin文本,但是当我使用请求获取文本时,我得到的只是:
æóæÇÌóÒóÚÇð áóæ ßÇäó áöáäóÝÓö ãóÌÒóÚõ
而不是这样:
اذا ما مَشَت نادى بما في ثِيابها ذكِيُّ الشذا والمَندَليّ المطَيَّرُ
我尝试了同样的代码在不同的网站,也使用阿拉伯语,代码工作得很完美,抓住了阿拉伯语文本没有任何问题
from bs4 import BeautifulSoup
import requests
a = requests.get("https://www.aldiwan.net/poem30.html")
a = a.text
你必须解码内容而不是文本
我试着用utf-8解码,但一直失败,所以我转到url,他们使用的是一种特定类型的字符集,即windows-1256。你知道吗
我用同样的东西来解码内容,瞧!你知道吗
相关问题 更多 >
编程相关推荐