有没有更好的方法在Python中处理这个URL?

10 投票
2 回答
2848 浏览
提问于 2025-04-15 22:56

我很好奇有没有更简单的方法来从网址中删除某个特定的参数。我想到的办法是这样的。不过感觉有点啰嗦。如果有推荐的库或者更简洁的Python写法,那就太好了。

parsed = urlparse(url)
if parsed.query != "":
    params = dict([s.split("=") for s in parsed.query.split("&")])
    if params.get("page"):
        del params["page"]
    url = urlunparse((parsed.scheme,
                      None,
                      parsed.path,
                      None,
                      urlencode(params.items()),
                      parsed.fragment,))
    parsed = urlparse(url)

2 个回答

11

使用 urlparse.parse_qsl() 来解析查询字符串。你可以一次性过滤掉这些内容:

params = [(k,v) for (k,v) in parse_qsl(parsed.query) if k != 'page']
9

我创建了一个小助手类,用来以结构化的方式表示一个网址:

import cgi, urllib, urlparse

class Url(object):
    def __init__(self, url):
        """Construct from a string."""
        self.scheme, self.netloc, self.path, self.params, self.query, self.fragment = urlparse.urlparse(url)
        self.args = dict(cgi.parse_qsl(self.query))

    def __str__(self):
        """Turn back into a URL."""
        self.query = urllib.urlencode(self.args)
        return urlparse.urlunparse((self.scheme, self.netloc, self.path, self.params, self.query, self.fragment))

然后你可以这样做:

u = Url(url)
del u.args['page']
url = str(u)

想了解更多内容,可以查看这个链接:Web development peeve

撰写回答