Python3.1中的SGML解析
我在尝试把feedparser这个库移植到Python3.1的时候,发现sgmllib这个模块在Python2.7之后就被淘汰了,后来又被删掉了。那么在Python3.1中,有什么替代的方案可以用来做类似的事情呢?
1 个回答
3
使用 lxml
,因为它非常高效,主要是因为它是用 c
语言写的。还有一个常用的HTML解析器叫 BeautifulSoup
,不过它是基于sgmllib的,所以我建议你选择 lxml
。