无法使用s获取完整内容

html = ''' <div class="elems"> <ul> <li>Item Name: titan </li> <li>Item No: 23003400 </li> <li>Item Sl: 2760400 </li> </ul> </div> '''

2条回答

网友

1楼 · 编辑于 2024-04-26 17:41:57

最简单的解决方案。数值在“li”标签内，而不是“b”标签内。你知道吗

from lxml import html as e

root = e.fromstring(html)
for items in root.cssselect(".elems"):
    item = [item.text_content() for item in items.cssselect("li")]
    print(''.join(item))

网友

2楼 · 编辑于 2024-04-26 17:41:57

通常我使用.itertext方法提取文本：

from lxml.html import fromstring

def extract_text(el, sep=' '):
    return sep.join(s.strip() for s in li.itertext() if s.strip())

tree = fromstring(html)
for li in tree.cssselect('.elems li'):
    print(extract_text(li))

编程相关推荐

使用导入范围函数下载文件时发生java错误
java是否提供内置的静态字符串。比较方法？
添加“再次播放？”Java中我的随机数猜测游戏的功能
java在tomcat 8中配置JPDA
编译器构造Java：检查编译时是否存在给定的方法名
当RedistreLimiter阻止请求时，java Spring云网关全局筛选器未执行
java无法将带有Gradle的单片Spring Boot应用程序转换为多模块
Eclipse（IDE）如何在没有公共类的情况下在Java中运行main方法？
用Java上传Youtube帖子
没有css和javascript的html Java httpGet页面正文

相关问题更多 >

编程相关推荐

热门问题

热门文章

无法使用s获取完整内容

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >