从Python文本文件中提取特定HTML标签之间的文本

1条回答

网友

1楼 · 发布于 2024-05-17 00:05:13

您可以使用类似BeautifulSoup

from bs4 import BeautifulSoup
str = '<span class="proflinkWrapper"><span class="proflinkPrefix">+</span><a class="proflink" href="https://xyzlink" id="123456">Donald</a></span>'
soup = BeautifulSoup(str,'lxml')
try:
    span = soup.find("span",{"class": "proflinkWrapper"}).find("span",{"class": "proflinkPrefix"})
    a = soup.find("a",id="123456")
    a.string = a.text.replace(a.text, "president")
    print (soup.prettify())
except:
    print ("Exception")

编程相关推荐

java将多个线程中的函数放入单个队列
数组在Java中，如何在不改变整数顺序的情况下找到整数组的顺序？
java控制器属于表示层？
java Apache Ivy和本地Maven repo如何处理使用Maven 3构建的快照
Java可与泛型类型进行比较
java这个表达式在泛型中是什么意思
JavaEclipse和TeamCity插件
java检测构造函数中的final是否为空
java如何在StanfordCoreNLP管道中同时使用词汇化和依赖性解析器？
java在AntUnit控制台日志中显示完整异常堆栈跟踪

相关问题更多 >

编程相关推荐

热门问题

热门文章

从Python文本文件中提取特定HTML标签之间的文本

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >