我有一个文本文件,每行都有一个HTTP请求。首先,我从文本文件创建了一个列表,现在尝试计算一个域发送请求的次数。 每一行都有完整的URL,所以我需要去掉“.com”之后的任何内容,以便只保留域并计算该域发出的请求总数。例如,根据下面的列表,输出将是
'https:/books.com':3
my_list = ['https:/news.com/main', 'https:/recipes.com/main',
'https:/news.com/summary', 'https:/recipes.com/favorites',
'https:/news.com/today', 'https:/recipes.com/book',
'https:/news.com/register', 'https:/recipes.com/',
'https:/books.com/main', 'https:/books.com/favorites',
'https:/books.com/sale']
您可以使用
re
和Counter
-re.match
提取域Counter
构造函数请注意,(生成器)理解中的
re.match
无法处理错误(如果列表包含无效URL,则可能会发生错误)。在这种情况下,您可以考虑使用循环-< /p>。相关问题 更多 >
编程相关推荐