使用Mechanize和Python抓取网站下拉列表
我想用 mechanize 和 Python 从一个网站获取可用航班的数据,网址是 http://www.jet4you.com,但是下拉列表的控制显示“none”,也就是说没有可用的选项。有没有办法用 mechanize、urllib 或者 beautifulsoup 获取这些 <options>
?
当我用 fiddler 提交表单时,可以看到下拉列表的值,但我用 mechanize 却无法选择它们。
br = mechanize.Browser()
br.possible_items("AvailabilityCompactSearchInputViewType$DropDownListMarketOrigin1")
["none"]
1 个回答
1
别再用Mechanize来处理JavaScript了。你可以使用一个支持JavaScript的浏览器模拟器,比如Selenium。我也试过用Mechanize,但它就是不行。