漂亮的汤和提取数组的字符串部分

2024-05-18 10:48:13 发布

您现在位置:Python中文网/ 问答频道 /正文

考虑到此URL: http://www.nyse.com/about/listed/chn.html

我试图找回这句话:“太平洋前日本基金”但是它不在汤里!?!

fundCode = 'chn'
url = 'http://www.nyse.com/about/listed/' + fundCode + '.html'
html = urllib2.urlopen(url)
soup = BeautifulSoup(html)

这很奇怪,因为桌子的其他部分都在汤里。

知道吗?


Tags: comhttpurl基金htmlwwwurllib2urlopen
1条回答
网友
1楼 · 发布于 2024-05-18 10:48:13

如果下载HTML(没有浏览器)

content = html.read()

您将看到页面数据是由JavaScript函数提供的。在

要从这个页面提取信息,您需要一个可以处理JavaScript的库。在

一种方法是使用Selenium,另一种方法是使用PyQt's WebKit。在

相关问题 更多 >