使用漂亮的Soup Python在HTML中查找1级内的所有文本

1条回答

网友

1楼 · 发布于 2024-05-15 16:12:23

{cd1>也包括所有子节点的问题。您只需要手动获取节点的子级的文本节点。另外，给定的文本节点中可能有多个文本节点，例如：

<div>
    Hello
        <div>
            foobar
        </div>
    world!
</div>

您希望它们如何连接？下面是一个将它们与一个空格连接起来的函数：

^{pr2}$
以我的例子：
In [27]: t = """ <div> Hello <div> foobar </div> world! </div>""" In [28]: soup = BeautifulSoup(t) In [29]: map(extract_text, soup('div')) Out[29]: [u'Hello world!', u'foobar']
你的例子是：
In [32]: t = """ <div id = "div1"> Text1 <div id="div2"> Text2 <div id="div3"> Text3 </div> </div> </div>""" In [33]: soup = BeautifulSoup(t) In [34]: map(extract_text, soup('div')) Out[34]: [u'Text1 ', u'Text2 ', u'Text3']

编程相关推荐

java在Hibernate中从两个具有不同功能的表（postgreSQL）映射一个实体
java jfreechart需要自定义Y轴，以便打印
Java：从外部获取类。罐子
java如何获取Appium服务器日志
具有完全相同内容的java重写函数会导致错误
java消息的类路径是什么。属性（如果在依赖项jar中）
循环/相等的java问题==
java如何使用ionic cordova angularjs将所选图像发送到spring controller以保存到服务器？
库中的java语言环境数据
java从JSON webservice检索安卓中的字节[]

相关问题更多 >

编程相关推荐

热门问题

热门文章