python中的Web取消text（）

from lxml.html import parse from urllib2 import urlopen def _clean(lst): for elm in lst: lnk=elm.findall('.//a') for this in lnk: lnk_txt.append(this.text_content()) state_txt.append(elm.findall('.//text()'))

1条回答

网友

1楼 · 发布于 2024-06-15 21:55:30

您需要找到a元素的following text sibling：

lnk.xpath("following-sibling::text()")

演示：

>>> import lxml.html
>>> data = '<li><a href="http://www.acu.edu/" target="_blank" class="institution">Abilene Christian University</a> (TX)</li>'
>>> li = lxml.html.fromstring(data)
>>> li.xpath("//a[@class='institution']/following-sibling::text()")[0].strip()
'(TX)'

编程相关推荐

java Android如何使用登录名和密码正确查询在线数据库？
java如何在运行时更改Jasper Reports PDF版本
javascript找到合适的Java WebSocket框架生成特定的JS代码
macos Java系统。getProperty问题
java ARCore TransformableNode在拖动后将localPosition设置为[x=0.0，y=0.0，z=0.0]
java覆盖无处不在？
java使用GET调用将登录表单连接到swing中的url
java如何拆分字符串并获取最后一部分？
java无法在firebase数据库的文本查看器上设置文本
java如何使用@RabbitListener优雅地停止使用消息

相关问题更多 >

编程相关推荐

热门问题

热门文章

python中的Web取消text（）

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >