如何获取URL中最后一个斜杠后的所有内容?
我想知道怎么在Python中提取一个网址最后一个斜杠后面的内容。比如,给定这些网址,应该返回以下结果:
URL: http://www.test.com/TEST1
returns: TEST1
URL: http://www.test.com/page/TEST2
returns: TEST2
URL: http://www.test.com/page/page/12345
returns: 12345
我试过用urlparse这个工具,但它给我的结果是整个路径的文件名,比如 page/page/12345
。
15 个回答
17
rsplit
应该能满足这个需求:
In [1]: 'http://www.test.com/page/TEST2'.rsplit('/', 1)[1]
Out[1]: 'TEST2'
95
还有一种(有点特别的)方法:
URL.split("/")[-1]
352
你不需要复杂的东西,只要看看标准库里的字符串方法,就能轻松把你的网址分成'文件名'部分和其他部分:
url.rsplit('/', 1)
所以你可以很简单地获取你感兴趣的部分:
url.rsplit('/', 1)[-1]