我试图从一个特定的网站削减时间格式。regex正在工作(使用regex tester进行了尝试,并且工作正常),但是当我尝试用Python运行代码时,我得到:
import urllib,re
sock = urllib.urlopen("http://www.wolframalpha.com/input/?i=time")
htmlSource = sock.read()
sock.close()
ips = re.findall( r'([01]?[0-9]{1}|2[0-3]{1}):[0-5]{1}[0-9]{1}:[0-5]{1}[0-9]{1}',htmlSource)
print ips
结果是:
>>>
['7', '4']
>>>
regextester.com上的时间用红色标记,我想按以下格式提取时间:xx:xx:xx(24小时)。你知道吗
为什么会这样?谢谢您!你知道吗
regexp中有一些多余的量词(那些
{1}
)。你可以移除它们。你知道吗另一件事是
re.findall
只返回捕获的时间。将第一个捕获更改为非caturing组(?: ... )
,并捕获整个正则表达式:我想应该是这样的。你知道吗
相关问题 更多 >
编程相关推荐