在regex中剥离url

2024-05-19 01:42:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图为一个充满url的数据库隔离域名,但是我遇到了一些regex问题。你知道吗

起始示例:

examples = ['www2.chccs.k12.nc.us', 'wwwsco.com', 'www-152.aig.com', 'www.google.com']

期望目标:

['chccs.k12.nc.us', 'sco.com', 'aig.com', 'google.com']

我一直在尝试一个两阶段的过程,在“www”之前添加一个“”,然后替换“www.”“,但这并不能得到我想要的结果。你知道吗

有正则表达式向导能帮忙吗?你知道吗

提前谢谢!你知道吗


Tags: com数据库url示例wwwgoogleexamplesregex
1条回答
网友
1楼 · 发布于 2024-05-19 01:42:20
import re

def extract(domain):
    return re.sub(r'^www[\d-]*\.?', '', domain)

examples = ['www2.chccs.k12.nc.us', 'wwwsco.com', 'www-152.aig.com', 'www.google.com']
result = [extract(d) for d in examples]
assert result == ['chccs.k12.nc.us', 'sco.com', 'aig.com', 'google.com'], result

相关问题 更多 >

    热门问题