为什么这个regexp不起作用

1条回答

网友

1楼 · 发布于 2024-05-16 21:35:38

不要使用正则表达式。使用实际的HTML解析器。我建议您改用BeautifulSoup：

from bs4 import BeautifulSoup

soup = BeautifulSoup(yourhtml)
languages = [s.get_text().strip() for s in soup.find_all('span', class_=True)]

演示：

>>> from bs4 import BeautifulSoup
>>> soup = BeautifulSoup('''\
... <span class="l r positive-icon">
... Turkish
... </span>
... <span>
... The.Mist[2007]DvDrip[Eng]-aXXo
... </span>
... <span class="l r neutral-icon">
... Vietnamese
... </span>
... <span>
... The.Mist.2007.720p.Bluray.x264.YIFY 
... </span>
... ''')
>>> [s.get_text().strip() for s in soup.find_all('span', class_=True)]
[u'Turkish', u'Vietnamese']

编程相关推荐

java访问私有字段而不使用getter方法？
使用PowerMockito在JavaEWSAPI中模拟测试拉订阅
启动活动时未保存java首选项并清除变量
java如何在servlet中检索子域？斯普林有帮手吗
java使用Docker从命令行构建Android项目
java Android，ActionBar后退按钮（setDisplayHomeAsUpEnabled（true））重新创建父活动
java在重用FileOutputStream时应该关闭流吗？
java使用RESTAPI将文件上载到s3 bucket
Java SOAP Web服务应用程序中的mysql用户登录方法不工作
java使用多个数字计算百分比并转换为长

相关问题更多 >

编程相关推荐

热门问题

热门文章

为什么这个regexp不起作用

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >