从URL提取

2024-04-26 10:20:16 发布

您现在位置:Python中文网/ 问答频道 /正文

如何从url中提取数据段?我试图找到国家代码和语言代码从网址

import re
url = https://www.url.com/content/test/abcd/da_dk/1234.html
#cc_lc = re.search(?, url)
cc ,lc = cc_lc.split(‘_’)
print(cc,lc)

Tags: 数据代码httpstestimportrecom语言
1条回答
网友
1楼 · 发布于 2024-04-26 10:20:16

你可以这样做

import re
url = "https://www.url.com/content/test/abcd/da_dk/1234.html"
url_list = url.split('/')
for el in url_list:
    if "_" in el:
        codes = el.split("_")
        if (len(codes) == 2):
            #use regex to check coade[0] and code[1] are valid cc and lc or not

相关问题 更多 >