使用Python抓取Yahoo财经头条

1 投票
2 回答
2843 浏览
提问于 2025-04-17 21:48

我正在使用Beautiful Soup这个工具,从这个页面 http://in.finance.yahoo.com/q?s=AAPL 提取头条新闻,但我需要的是过去三个月的新闻,也就是从2013年12月10日到2014年3月10日的新闻。不过,我现在只能提取到这个特定页面上的新闻。请问如何才能提取到任何特定公司的所需新闻呢?

代码:

url = 'http://in.finance.yahoo.com/q?s=AAPL'
data = urllib2.urlopen(url)
soup = BeautifulSoup(data)

divs = soup.find('div',attrs={'id':'yfi_headlines'})
div = divs.find('div',attrs={'class':'bd'})
ul = div.find('ul')
lis = ul.findAll('li')
hls = []
for li in lis:
    headlines = li.find('a').contents[0]
    print headlines

2 个回答

0

http://in.finance.yahoo.com/q?s=AAPL这个网站上,点击“AAPL的更多头条新闻”。接着你会看到一个链接,里面有一个日期和时间的字段。你可以修改这个字段,这样就可以得到你想要的信息了。(例如:http://in.finance.yahoo.com/q/h?s=AAPL&t=2014-02-08T15:06:40+05:30

0

我觉得你的问题主要跟你获取数据的地方有关。如果你需要过去三个月的数据,应该去这个网站 http://in.finance.yahoo.com/q/hp?s=AAPL 查询,那里的数据都以表格的形式展示出来,方便你查看。

撰写回答