Xpath、DOM、BeautifulSoup、lxml等 哪种是解析网页的最快方法?
我知道怎么用Python解析网页。我的问题是,所有解析方法中哪种速度最快?它和其他方法相比快多少呢?
我知道的解析方法有Xpath、DOM、BeautifulSoup,还有使用Python的find
方法。
2 个回答
1
lxml是用C语言写的。如果你用的是x86架构,选择它是最好的。说到技术,Xpath和DOM之间没有太大区别,它们的处理速度都很快。不过,如果你在BeautifulSoup中使用find或findAll,这会比其他方法慢。因为BeautifulSoup是用Python写的,这个库在解析数据时需要消耗很多内存,当然,它也使用了Python库中的标准搜索方法。