在一个标签外和另一个标签内获取文本
我正在用BeautifulSoup解析一个网页,里面有一些元素像这样:
<td><font size="2" color="#00009c"><b>Consultant Registration Number :</b></font> 16043646</td>
这个结构总是一个 <td>
标签,里面的第一部分被 <font><b>
包围,而 </font>
标签后面的文本可能是空的。我该怎么获取这个字体标签后面的文本呢?
在这个例子中,我想得到 "16043646"
。如果HTML是这样的话:
<td><font size="2" color="#00009c"><b>Consultant Registration Number :</b></font></td>
我想得到 ""
1 个回答
5
当然可以!请看下面的内容:
这个问题主要是在讨论如何在编程中处理一些特定的情况。比如,当你在写代码的时候,可能会遇到一些错误或者意外的结果。这个时候,你需要找到解决办法,确保你的代码能够正常运行。
有时候,程序的运行结果可能和你预期的不一样,这可能是因为代码中的某些部分没有按照你想的那样工作。为了找出问题所在,你可以使用一些调试工具,或者在代码中加入一些打印信息,帮助你了解程序的运行情况。
总之,编程中遇到问题是很正常的,关键是要学会如何去解决这些问题,逐步提高自己的编程能力。
希望这些信息对你有帮助!
>>> from BeautifulSoup import BeautifulSoup
>>> text1 = '<td><font size="2" color="#00009c"><b>Consultant Registration Number :</b></font> 16043646</td>'
>>> text2 = '<td><font size="2" color="#00009c"><b>Consultant Registration Number :</b></font></td>'
>>> BeautifulSoup(text1).td.font.nextSibling
u' 16043646'
>>> BeautifulSoup(text2).td.font.nextSibling
>>>