把所有的p元素合并成一个字符串？

def scraping(url, html): data = {} soup = BeautifulSoup(html,"lxml") data["news"] = [] page = soup.find("div", {"class":"container_news"}).findAll('p') page_text = '' for p in page: page_text += ''.join(p.findAll(text = True)) data["news"].append(page_text) print(page_text) return data

1条回答

网友

1楼 · 发布于 2024-04-19 11:02:21

我不确定保持data["news"]的重要性，但这可以用一行代码来完成：

page_text = ' '.join(e.text for p in page for e in p.findAll(text=True))

您可以使用任何您想要的字符串作为分隔符，而不是' '。你知道吗

否则

page_text = []

for p in page:
    page_text.extend(e.text for e in p.findAll(text=True))
    data["news"].append(page_text)

print(' '.join(page_text))

编程相关推荐

Java谷歌地图将地址转换为坐标
java舍入错误给了我无效的答案
JavaSpring3。0 mvc问题（请求的资源不可用）
java在关闭GraphStream时不关闭Swing主应用程序
java使用特定的orderby从包含多个子节点的FireBase数据库检索数据
java是否可以不安全地访问JVM未使用的对象？
java读取单词的第一个字母并选择其字母表编号
java在同一个包中导入类
安卓 java。lang.IndexOutOfBoundsException:索引0无效，大小为0
java JTextPane仅以单行显示插入的组件

相关问题更多 >

编程相关推荐

热门问题

热门文章

把所有的p元素合并成一个字符串？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >