仅从url提取域名，去掉路径（Python）

3条回答

网友

1楼 · 编辑于 2024-04-20 11:27:50

假设您正在使用python3并且不想将regex用于作业

>>> from urllib.parse import urlparse
>>> url = "http://supremecosts.com/contact-us/"
>>> obj = urlparse(url)
>>> obj
ParseResult(scheme='http', netloc='supremecosts.com', path='/contact-us/', params='', query='', fragment='')
>>> obj.geturl()
'http://supremecosts.com/contact-us/'
>>> obj.netloc
'supremecosts.com'

网友

2楼 · 编辑于 2024-04-20 11:27:50

可能一个愚蠢但有效的方法是：
将URL保存为字符串，然后从后向前扫描。一旦你遇到一个句号，把前面3个空格的所有东西都扔掉。我相信网址在域名后面没有句号。如果我错了，请纠正我。你知道吗

网友

3楼 · 编辑于 2024-04-20 11:27:50

您可以使用regex这样做：

import re

text = 'http://supremecosts.com/contact-us/'

m = re.search('(https?:\/\/[^:\/\n]+)', text)
if m:
    print(m.group(1))

工作example

编程相关推荐

java RestTemplate到elasticsearch 6.7.0搜索>错误请求
java如何在OpenGL中对半透明三角形排序？
java如何将Pentaho6.0连接到HadoopHive
java更改图像视图大小
SQL查询在TOAD中运行良好，但在java代码中则不行
java需要根据事件发送HTTP请求
java HTMLUnit在javascript异常上挂起/无限循环
java阵列访问如何影响性能？
使用回滚时不引发异常的java事务测试方法
java如何在最近屏幕后返回到上一个活动

相关问题更多 >

编程相关推荐

热门问题

热门文章

仅从url提取域名，去掉路径（Python）

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >