Python中正则表达式无法捕获模式

regex = '<ul class="w462">(.*?)</ul>' opener.open(baseurl) urllib2.install_opener(opener) ... rest of code omitted ... requestData = urllib2.urlopen(request) htmlText = requestData.read() pattern = re.compile(regex) movies = re.findall(pattern, htmlText) # Lines below will always returns empty. if not movies: print "List is empty. Printing source instead...", "\n\n" print htmlText else: print movies

1条回答

网友

1楼 · 发布于 2024-04-26 04:19:40

默认情况下，regexp中的.匹配除换行符以外的任何字符。所以您的regexp不能匹配跨越多行（至少包含一个换行符）的任何内容。你知道吗

将编译行更改为：

pattern = re.compile(regex, re.DOTALL)

改变.的意思。使用re.DOTALL，.将匹配任何字符（包括换行符）。你知道吗

编程相关推荐

java为什么运行按钮在Eclipse中不起作用？
java构造函数：实例变量是否为对象存储单独的值？
java使用jquery获取值
生产文件夹和源文件夹中的java单元测试
java递归问题这个解决方案正确吗？有更简单的解决方案吗？
java Android sqlite正在检索已选中中的行
javacom。谷歌。云数据存储。DatastoreException:请求缺少必需的身份验证凭据
java无法在Linux Ubuntu 12.04上运行maven2
在监视器的上下文中，被阻塞的线程在被notify（）调用唤醒后在何处继续执行？
安卓如何从游标获取Bool（Java SQLite）

相关问题更多 >

编程相关推荐

热门问题

热门文章