在Python中实现WGET和GREP的最佳方法

myhostname % wget -q http://www.nasdaq.com/symbol/amzn -O - | egrep "qwidget-dollar" <div id="qwidget_lastsale" class="qwidget-dollar">$1969.5992</div> <div class="qwidget-dollar"><div>*  </div></div>

1条回答

网友

1楼 · 发布于 2024-05-23 20:38:57

您可以使用re库，即正则表达式的Python标准库实现。对于这类任务，requests库也是一个很好的工具。你知道吗

例如

import re 
import requests

url = "http://www.nasdaq.com/symbol/amzn"
regex = '<div id="qwidget_lastsale" class="qwidget-dollar">$(.*?)</div>'

# Retrieve the page.
page_text = requests.get(url).text 
# Print the first capture group of the regular expression search.
print(re.match(regex, page_text).group(1))

但是，对于任何更复杂的HTML解析任务，我建议使用lxml.html或BeautifulSoup库。你知道吗

编程相关推荐

javascript生成两点之间的固定纬度和经度
java为什么不删除并重命名文件？
求数组的和
java在漂亮面孔中使用正则表达式
SOAP（java）中的Hello World。如何修复它？
java I获取应用程序生成错误，配置为“”的资源“attr/arc_position”的值重复
云基础环境中的Java SFTP客户端应用
谷歌应用程序引擎Java查询日期不正常？
java使用cancel按钮对JOptionPane InputDialog循环进行转义
java数字格式总是返回异常

相关问题更多 >

编程相关推荐

热门问题

热门文章

在Python中实现WGET和GREP的最佳方法

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >