在Python中实现WGET和GREP的最佳方法

2024-05-23 20:38:57 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在努力找到最好或最有效的方法来解决这个问题。你知道吗

我从命令行获取这样的股价:

myhostname % wget -q http://www.nasdaq.com/symbol/amzn -O - | egrep "qwidget-dollar"                   
                                    <div id="qwidget_lastsale" class="qwidget-dollar">$1969.5992</div>
                        <div class="qwidget-dollar"><div>*&nbsp;&nbsp;</div></div>

我试着把它放到一个python文件中,只获取美元的数量。你知道吗

url = "http://www.nasdaq.com/symbol/amzn"
filename = wget.download(url)
print (filename)

给了我整页。我不知道什么是最好的方法来获取美元的价值,虽然。感谢您的帮助。你知道吗


Tags: 方法divcomhttpurlwwwwgetfilename
1条回答
网友
1楼 · 发布于 2024-05-23 20:38:57

您可以使用re库,即正则表达式的Python标准库实现。对于这类任务,requests库也是一个很好的工具。你知道吗

例如

import re 
import requests

url = "http://www.nasdaq.com/symbol/amzn"
regex = '<div id="qwidget_lastsale" class="qwidget-dollar">$(.*?)</div>'

# Retrieve the page.
page_text = requests.get(url).text 
# Print the first capture group of the regular expression search.
print(re.match(regex, page_text).group(1)) 

但是,对于任何更复杂的HTML解析任务,我建议使用lxml.htmlBeautifulSoup库。你知道吗

相关问题 更多 >