RSS提要中的奇怪链接

2024-04-26 12:15:33 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试用python制作RSS提要scraper,并且 例如,发现xml文件的内容有点关联 示例:

Pour leur dernier match de pr\xe9paration, les Bleus affrontent les Jama\xefcains au stade Pierre-Mauroy de Lille.<img border="0" height="1" src="http://rss.lemonde.fr/c/205/f/3050/s/3b4a3f60/sc/3/mf.gif" width="1" /><br clear="all" /><br /><br /><a href="http://da.feedsportal.com/r/199106763945/u/57/f/3050/c/205/s/3b4a3f60/sc/3/rc/1/rc.htm" rel="nofollow"><img border="0" src="http://da.feedsportal.com/r/199106763945/u/57/f/3050/c/205/s/3b4a3f60/sc/3/rc/1/rc.img" /></a><br /><a href="http://da.feedsportal.com/r/199106763945/u/57/f/3050/c/205/s/3b4a3f60/sc/3/rc/2/rc.htm" rel="nofollow"><img border="0" src="http://da.feedsportal.com/r/199106763945/u/57/f/3050/c/205/s/3b4a3f60/sc/3/rc/2/rc.img" /></a><br /><a href="http://da.feedsportal.com/r/199106763945/u/57/f/3050/c/205/s/3b4a3f60/sc/3/rc/3/rc.htm" rel="nofollow"><img border="0" src="http://da.feedsportal.com/r/199106763945/u/57/f/3050/c/205/s/3b4a3f60/sc/3/rc/3/rc.img" /></a><br /><br /><a href="http://da.feedsportal.com/r/199106763945/u/57/f/3050/c/205/s/3b4a3f60/sc/3/a2.htm"><img border="0" src="http://da.feedsportal.com/r/199106763945/u/57/f/3050/c/205/s/3b4a3f60/sc/3/a2.img" /></a><img border="0" height="1" src="http://pi.feedsportal.com/r/199106763945/u/57/f/3050/c/205/s/3b4a3f60/sc/3/a2t.img" width="1" />

这是来自《世界报》的RSS提要的一个条目,它包含 一些奇怪的链接:

http://rss.lemonde.fr/c/205/f/3050/s/3b4a3f60/sc/3/mf.gif
http://da.feedsportal.com/r/199106763945/u/57/f/3050/c/205/s/3b4a3f60/sc/3/rc/1/rc.htm
http://da.feedsportal.com/r/199106763945/u/57/f/3050/c/205/s/3b4a3f60/sc/3/rc/1/rc.img
http://da.feedsportal.com/r/199106763945/u/57/f/3050/c/205/s/3b4a3f60/sc/3/rc/2/rc.htm
...

它们中的大多数要么是空白的,要么是完全无法访问的。 它们有什么用途?你知道吗

有时我在访问这些链接时也会收到这样的信息:

Unfortunately we are unable to show the requested link, sorry for any inconvenience. The likely cause is that either the link has expired or you are using a feed reader whose browser engine is not the same as the default browser on your PC e.g. you are using a Microsoft product (like Outlook) to read the feed but you have Firefox set as the default browser. If you change your default browser (in this example change it to Microsoft's Internet Explorer) you will be able to follow the link.

这是胡说八道,因为我在Linux上使用firefox,它是默认的浏览器。你知道吗

链接到源:http://www.lemonde.fr/rss/une.xml


Tags: thetobrsrccomyouhttpimg
1条回答
网友
1楼 · 发布于 2024-04-26 12:15:33

没有实际的饲料网址,我不能回答细节,但它很可能是feedsportal广告项目的饲料跟踪。<img>标记将帮助他们计算加载给定提要的次数,而html链接可能用于计算点击次数和跟踪访问者。。。你知道吗

相关问题 更多 >