监控网站在线状态(包括资源)的Python工具
我想要一个工具,定期检查我们的网站,确保它们正常运行并且可以响应。Python是我喜欢用来快速开发小工具的语言。
我知道可以用urllib2
来ping一下服务器,但我其实想要检查所有的资源是否都能正常使用,比如CSS、JS、图片等等。就像浏览器加载网页时做的那样——先获取HTML,然后再获取所需的资源,并检查是否有400或500的错误。
在Python中有没有简单的方法可以做到这一点?我可能可以用正则表达式从HTML中提取资源的URL,但我不想担心自己是否在做错了。
有没有什么工具或者技巧可以帮我完成这项工作,还是我必须自己解析HTML?或者我是不是走错了方向?
1 个回答
1
如果你想监控网站的可用性,我推荐使用一些第三方服务,比如newrelic.com或者site24x7.com。
如果你想自己做一个(其实如果需求不复杂,这并不难),你只需要用一个HTML解析器,遍历网页的结构,去请求你链接的资源。记得不要用正则表达式哦。