我有一些类似下面的URL
https://data.hova.com/strap/nik/sql_output1574414532.89.zip
https://data.hova.com/strap/asr/sql_output1574414532.89.zip
https://data.hova.com/strap/olr/sql_output1574414532.89.zip
现在我只想分别提取zip
文件名iesql_output1574414532.89.zip
、sql_output1574414532.89.zip
、sql_output1574414532.89.zip
现在我可以使用一个简单的split
来获取文件名,但是如果您观察的话,zip
文件前面的目录名会发生变化,比如nik
、asr
、olr
等等
所以我想使用regex
,这样我只看以sql开头,以zip结尾的任何内容
这就是我所做的
import re
string = "https://data.hova.com/strap/nik/sql_output1574414532.89.zip"
pattern = r'^sql\.zip$'
match = re.search(pattern, string)
print(match)
但是match
作为None
出现。我做错了什么
模式
r'^sql\.zip$'
只匹配一个字符串:“sql.zip”出于您的目的,您需要类似于
sql.+zip$
的内容,或者,如果您希望在文件名之前的URL中遇到sql
字符串,请将其更改为sql[^/]+zip$
相关问题 更多 >
编程相关推荐