使用Python抓取*.aspx内容
我在抓取一个动态生成的表格时遇到了困难,这个表格是在ASPX页面上生成的。我想从一个网站上抓取油价,像这个GasPrices。我可以提取油价表中的所有信息(比如地址、提交时间等等),但就是抓不到实际的油价。
有没有办法可以抓取油价呢?也就是说,能不能以某种方式获取到它的文本表示。我对ASP/ASPX不是很熟悉,但现在生成的内容在最终的HTML中并没有显示出来。我是用Python来进行抓取的,不过这不太重要,除非有特定的库可以用...
提前谢谢你们。
1 个回答
4
页面的来源(aspx)在这里不是问题。
看起来他们正在积极防止数据抓取。那些数字不是字体,而是几个并排的
元素,每个都有一个背景图片,这些图片上是数字。他们真的不想让人抓取数据。
(当然,如果你真的很想抓取,可能还是能找到方法,比如把
的类名映射到... 他们的防护措施并不是特别复杂)
注意链接页面底部的版权声明