在一个标签外和另一个标签内获取文本

5 投票
1 回答
1231 浏览
提问于 2025-04-17 00:21

我正在用BeautifulSoup解析一个网页,里面有一些元素像这样:

<td><font size="2" color="#00009c"><b>Consultant Registration Number  :</b></font>  16043646</td>

这个结构总是一个 <td> 标签,里面的第一部分被 <font><b> 包围,而 </font> 标签后面的文本可能是空的。我该怎么获取这个字体标签后面的文本呢?

在这个例子中,我想得到 "16043646"。如果HTML是这样的话:

<td><font size="2" color="#00009c"><b>Consultant Registration Number  :</b></font></td>

我想得到 ""

1 个回答

5

当然可以!请看下面的内容:

这个问题主要是在讨论如何在编程中处理一些特定的情况。比如,当你在写代码的时候,可能会遇到一些错误或者意外的结果。这个时候,你需要找到解决办法,确保你的代码能够正常运行。

有时候,程序的运行结果可能和你预期的不一样,这可能是因为代码中的某些部分没有按照你想的那样工作。为了找出问题所在,你可以使用一些调试工具,或者在代码中加入一些打印信息,帮助你了解程序的运行情况。

总之,编程中遇到问题是很正常的,关键是要学会如何去解决这些问题,逐步提高自己的编程能力。

希望这些信息对你有帮助!

>>> from BeautifulSoup import BeautifulSoup
>>> text1 = '<td><font size="2" color="#00009c"><b>Consultant Registration Number  :</b></font>  16043646</td>'
>>> text2 = '<td><font size="2" color="#00009c"><b>Consultant Registration Number  :</b></font></td>'
>>> BeautifulSoup(text1).td.font.nextSibling
u'  16043646'
>>> BeautifulSoup(text2).td.font.nextSibling
>>>

撰写回答