如何识别Python中的任意四个int

网友

1楼 · 编辑于 2024-04-25 06:50:41

相关：

蓝图：

import re
regex = re.compile(r'2011\d{4}')
print regex.match(your_string)

当然：你读过正则表达式：

http://docs.python.org/library/re.html

网友

2楼 · 编辑于 2024-04-25 06:50:41

在处理url时，只要有可能，就应该考虑使用urlparse模块。这适用于解析url。但您的URL不是urlparse的格式良好的URL。（提示：它不是以scheme/protocol'http'开头的）。你知道吗

对于您的特定任务，可以使用正则表达式，类似于：

>>> s = 'www.examplescraper.com/fghxbvn/17901234.html'  
>>> import re
>>> p = re.compile('(\d{4,4}).html')
>>> p.search(s).groups()[0]
'1234'

网友

3楼 · 编辑于 2024-04-25 06:50:41

我并不完全理解你的问题，但是你可以使用re模块轻松地解析出一个特定格式的文本，就像你在这里看到的那样。例如：

>>> import re
>>> url = "www.examplescraper.com/fghxbvn/17901234.html"
>>> re.match( "(\S+/)(\d{4})(\d{4}).html", url ).groups()
('www.examplescraper.com/fghxbvn/', '1790', '1234')

这会像您描述的那样将URL拆分为一个元组。请务必阅读re模块上的文档。HTH公司

我的问题：

相关问题更多 >

编程相关推荐

热门问题

热门文章