从BeautifulSoup Python获取CDATA

['//<![CDATA[\n "url":"https://xxxx.meraki.com/xxxxxxx/n/xxxxx/manage/nodes/list","name":"Switches","admin_only":false},{"is_current":false,"url":"https://nxx.meraki.com/xxxxx/n/xxxxx/manage/configure/switchports","name":"Switch ports","admin_only":false},{"is_current":false,"url":"https://xxxx.meraki.com/Dormitory/n/xxxxxxx/manage/configure/dhcp_servers"//]]>\n ']

1条回答

网友

1楼 · 发布于 2024-05-23 16:14:17

你需要的是这个

from BeautifulSoup import BeautifulSoup
import re

// source.html contains your html above
f = open('source.html')
soup = BeautifulSoup(''.join(f.readlines()))
cdata = soup.find(text=re.compile("CDATA"))

或者你可以试试这个

for script in soup(['script', 'style']):
        script.decompose()

    text = soup.get_text()
    lines = (line.strip() for line in text.splitlines())
    chunks = (phrase.strip() for line in lines for phrase in line.split("  "))
    text = '\n'.join(chunk for chunk in chunks if chunk)

编程相关推荐

java SimpleCursorAdapter删除值
java结束while循环条件
java检查设备是否连接到特定网络
java组织。冬眠MappingException找不到逻辑名称为annotation getter的列
为什么java邮件中会抛出此异常？
加载SDK时发生java Eclipse错误
返回奇怪输出的Java数组
JavaXStream和对象类序列化
将枚举列表传递给namedQuery后出现java非法转换异常。Hibernate中的setParameter（）
java Android studio不允许我在字符串上使用开关？

相关问题更多 >

编程相关推荐

热门问题

热门文章

从BeautifulSoup Python获取CDATA

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >