Python HTML 解析
我需要解析一些HTML格式的邮件,这些邮件虽然内容相似,但并不完全一样。我想提取一些信息,比如日期、金额、供应商等等。不过,根据邮件的发件人,邮件的格式会有所不同。
我该如何在Python中从各种不同的HTML格式中提取这些共同的信息呢?
谢谢大家的建议。
3 个回答
2
BeautifulSoup和lxml都是不错的HTML解析工具。BeautifulSoup使用起来稍微方便一些,但有些地方可能会有点小问题。
2
你可以使用Beautiful Soup这个工具来解析Python中的HTML代码。
7
你一定要考虑使用 Beautiful Soup 这个库。