在Python中操作网站下拉菜单
我一直在网上寻找一个问题的答案,但由于我对网页编程和HTML不太熟悉,所以可能找不到答案。如果这个问题有明显的答案,那我就先说声抱歉,打扰大家了。我想从一个网站上提取一些文本信息,我找到了一个叫html2text.py的Python脚本,它能很好地把网站内容转成我可以处理的格式。不过,为了获取所有的信息,我需要访问网站上的一个下拉菜单。这个下拉菜单控制着显示哪个年份的数据,而我想获取所有可用的年份。我看到用urllib2可以访问网站,看起来也可以通过这种方式向网站发送信息,但我还没弄明白怎么操作下拉菜单。我感兴趣的网站是http://www.nfldata.com/nfl-stats/team-stats.aspx,希望这能帮到我。提前感谢你们提供的任何建议。
-Matt
2 个回答
1
你看到的不是一个下拉菜单,而是一个选择控件。
你应该能够解析这个控件,找到所有的 <option value="X">name</option>
选项。这里的 X 就是你需要的内容。
1
看看Python里面的xml库。你可以把原始的HTML文本解析成一个文档对象模型(DOM)接口: