将格式为“\uxxxxxx”的unicode转换为字符串或文本

2024-06-16 10:37:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在写一个python脚本来提取facebook视频的url。但是在视频页面的源代码中,我在url中看到了一些格式为\uxxxxxx的字符。在

例如,url的格式是

https\u00253A\u00255C\u00252F\u00255C\u00252Ffbcdn-video-a.akamaihd.net\u00255C\u00252Fhvideo-ak-prn2\u00255C\u00252Fv\u00255C\u00252F753002_318048581647953_53890_n.mp4\u00253Foh\u00253D64e3e8ecf7e88f1da335d88949b2dc1f\u002526oe\u00253D52226D10\u002526__gda__\u00253D1377987338_9e37fb163a1d37d4b06ab7cff668f7dc\u002522\u00252C\u002522

\u00253A是冒号(:),但如何转换它。在

当我喜欢的时候

^{pr2}$

我明白了

'https%3A%5C%2F%5C%2Ffbcdn-video-a.akamaihd.net%5C%2Fhvideo-ak-prn2%5C%2Fv%5C%2F753002_318048581647953_53890_n.mp4%3Foh%3D64e3e8ecf7e88f1da335d88949b2dc1f%26oe%3D52226D10%26__gda__%3D1377987338_9e37fb163a1d37d4b06ab7cff668f7dc%22%2C%22

我想要确切的网址,而不是百分比。在

我找了很多东西,但找不到任何帮助。在

提前谢谢

编辑

有没有办法把facebook页面的全部源代码都传递过来,然后把所有这些复杂的unicode字符转换成简单的unicode字符。在


Tags: url视频facebook源代码video格式unicode页面
1条回答
网友
1楼 · 发布于 2024-06-16 10:37:20
>>> import urllib
>>> s = b'https\u00253A\u00255C\u00252F\u00255C\u00252Ffbcdn-video'
>>> print urllib.unquote_plus(s.decode('unicode_escape'))
https:\/\/fbcdn-video

你的线好像反斜杠了。在

^{pr2}$

相关问题 更多 >