如何使用Python提取网页上的动态时间计数器
我正在用Python的BeautifulSoup
库抓取一些网站的数据。最近我发现一个网站上有一个倒计时器,我想把它提取出来。这个倒计时器显示的是网站上某些信息的剩余时间。每秒钟都有一些JavaScript的方法在更新这个innerHTML
内容。有没有人知道怎么提取这个倒计时器的值?
1 个回答
0
我不知道你为什么想要抓取那个内容,因为网上有很多免费的JavaScript倒计时器代码,只要在谷歌上一搜就能找到。这里有我最喜欢的一个,作者是Robert Hashemian:http://www.hashemian.com/tools/javascript-countdown.htm
不过,如果你还是想要抓取的话,你需要查看一下网站的HTML源代码。如果倒计时器的JavaScript代码直接写在网页里,你得找到开始和结束的<script>
和</script>
标签,然后把中间的内容复制下来(这其实就失去了自动抓取的意义,因为你还是得去找那个脚本)。如果脚本是在一个外部的js文件里(这种情况更常见),那直接下载那个文件会更好。