修改beautifulSoup代码以提取单词

2024-03-28 21:53:37 发布

您现在位置:Python中文网/ 问答频道 /正文

以下是我在网上找到的一些代码,可以从网站上获取价格(即小数)。我需要修改这段代码,使它不返回十进制数,而是返回一个字符串。在

from bs4 import BeautifulSoup 
import urllib, string, sys, urllib2, re, time 
start = time.time() 
# Find Bloomberg Brent Price 
rawBloomData = urllib2.urlopen("http://www.bloomberg.com/energy/").read() 
BloomSoup = BeautifulSoup(rawBloomData) 
brent = BloomSoup.findAll('tr')[14] 
BloomPrice = str(re.search(re.compile (r"\d+\.\d*"),str(brent.contents)).group())
print (BloomPrice)

这将使布伦特原油价格回升。我需要抓住这个词,那就是“价格”。 当我把代码行从

^{pr2}$

它应该会回来

'Price'

Tags: 代码importretime网站价格urllib2price
1条回答
网友
1楼 · 发布于 2024-03-28 21:53:37

只是这一行仍然在寻找\d+\.\d*形式的十进制数:

BloomPrice = str(re.search(re.compile (r"\d+\.\d*"),str(brent.contents)).group())

更改代码,使其从brent字符串中提取第三个单词。在

相关问题 更多 >