Python拆分HTML

2条回答

网友

1楼 · 编辑于 2024-04-19 22:10:45

我不习惯与lxml.xpath一起工作，所以我总是倾向于使用BeautifulSoup。以下是BeautifulSoup的解决方案：

>>> HTML = """<tr id="one">
...     <span class="x">X</span>
...     <span class="ax">X</span>
...     <span class="xa">X</span>
...     </tr>"""
>>>
>>> from BeautifulSoup import BeautifulSoup
>>> soup = BeautifulSoup(HTML)
>>> tr = soup.find('tr', {'id':'one'})
>>> span = tr.find('span', {'class':'x'})
>>> span
<span class="x">X</span>
>>> span.text
u'X'

网友

2楼 · 编辑于 2024-04-19 22:10:45

You need something called "xpath".

from lxml import html
tree = html.fromstring(my_string)
x = tree.xpath('//*[@id="one"]/span[@class="x"]/text()')
print x[0] # X

编程相关推荐

即使值等于null，java也会检索行
java如何正确地创建子类的新实例
java集合。shuffle未按预期工作
elasticsearch使用JAVA API从Elastic Search建议搜索响应中提取源数据
mysql HTTP状态500 java。lang.NullPointerException
具有多个前端服务实例和后端工作者的java ZMQ请求/响应
通过短信、电子邮件、twitter、黑莓上的facebook分享java
java根据netbeans中的单选按钮切换组件的“enable”属性
java托管Bean不工作：调用NotingMB文件中的save函数时出现空指针异常
如何在java中对包含两个以上异构对象的列表进行排序？

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python拆分HTML

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >