我想通过RE从包含jquery
作为子字符串的输入内容获取JS文件名。在
这是我的代码:
第一步:从内容中提取JS文件。在
>>> data = """ <script type="text/javascript" src="js/jquery-1.9.1.min.js"/>
... <script type="text/javascript" src="js/jquery-migrate-1.2.1.min.js"/>
... <script type="text/javascript" src="js/jquery-ui.min.js"/>
... <script type="text/javascript" src="js/abc_bsub.js"/>
... <script type="text/javascript" src="js/abc_core.js"/>
... <script type="text/javascript" src="js/abc_explore.js"/>
... <script type="text/javascript" src="js/abc_qaa.js"/>"""
>>> import re
>>> re.findall('src="js/([^"]+)"', data)
['jquery-1.9.1.min.js', 'jquery-migrate-1.2.1.min.js', 'jquery-ui.min.js', 'abc_bsub.js', 'abc_core.js', 'abc_explore.js', 'abc_qaa.js']
步骤2:获取子字符串为jquery
的JS文件
我能不能在步骤1中的第2步中重新设计模式以获得结果?在
当然可以。一种方法是使用
这将匹配
"js/
之后的所有内容,直到最接近的"
,如果它包含jquery
的任何地方。如果您对jquery
的位置有更多的了解(例如,如果它总是在开头),那么您可以相应地调整regex。如果要确保
^{pr2}$jquery
没有被其他字母数字字符直接包围,请使用word boundary anchors:相关问题 更多 >
编程相关推荐