我一直在网上寻找以下问题的答案,我之所以没有成功,可能是因为我在web编程/html方面缺乏经验。如果是这样,而且有一个明显的答案,抱歉打扰你们。我一直试图解析一个网站上的一堆文本,我发现了python脚本html2文本.py,它以我可以解析的方式展示了网站。但是,为了获得所有信息,我需要访问网站上的下拉菜单。下拉菜单控制显示哪一年的数据,我想得到所有可用的年份。我见过,使用urllib2,我可以访问一个网站,看起来我也可以用这种方式向网站发送信息,但我还没有弄清楚如何操作下拉菜单。我感兴趣的网站是http://www.nfldata.com/nfl-stats/team-stats.aspx,如果这有帮助的话。提前感谢您提供的任何建议。在
-马特
你看到的不是一个下拉菜单,而是一个选择小部件。在
您应该能够解析它,并找到所有
<option value="X">name<option>
项。X是你需要的。在查看python中的xml库。您可以获取原始html文本并将其解析为文档对象模型(DOM)接口:
http://docs.python.org/library/xml.dom.minidom.html
相关问题 更多 >
编程相关推荐