Python HTML 解析

1 投票
3 回答
6387 浏览
提问于 2025-04-16 12:32

我需要解析一些HTML格式的邮件,这些邮件虽然内容相似,但并不完全一样。我想提取一些信息,比如日期、金额、供应商等等。不过,根据邮件的发件人,邮件的格式会有所不同。

我该如何在Python中从各种不同的HTML格式中提取这些共同的信息呢?

谢谢大家的建议。

3 个回答

2

BeautifulSoup和lxml都是不错的HTML解析工具。BeautifulSoup使用起来稍微方便一些,但有些地方可能会有点小问题。

2

你可以使用Beautiful Soup这个工具来解析Python中的HTML代码。

7

你一定要考虑使用 Beautiful Soup 这个库。

撰写回答