使用Python访问LinkedIn公共页面

8 投票
1 回答
8269 浏览
提问于 2025-04-18 07:28

我想访问我公开的LinkedIn页面。在我的本地电脑上,下面的代码可以正常工作:

import requests
url = "http://de.linkedin.com/pub/ankush-shah/73/9/982"
html = requests.get(url).text
print html

这段代码能正确显示我的个人资料的HTML内容。

但是当我在Heroku服务器上执行相同的代码时,我(猜测)被重定向到其他地方,得到了这个HTML。

另外,当我在Heroku服务器上使用urllib2时:

import urllib2
url = "http://de.linkedin.com/pub/ankush-shah/73/9/982"
u = urllib2.urlopen(url)

这会抛出一个urllib2.HTTPError: HTTP Error 999: Request denied的错误。

因为我使用了virtualenv,所以我本地电脑上的所有库和Heroku服务器上安装的完全一样。请问LinkedIn是否会阻止来自像Heroku这样的服务器的HTTP请求?任何帮助或建议都非常感谢。

1 个回答

7

正如这里提到的,LinkedIn不允许直接访问他们的数据。他们已经把Heroku的IP地址列入黑名单,所以唯一能获取数据的方法就是使用他们提供的API。

撰写回答