我有一份来自我国一家报纸网站的网址和标题列表。一般来说:
x = ['URL1','news1','news2','news3','URL2','news1','news2','URL3','news1']
每个URL元素都有相应的“news”元素序列,这些元素的长度可能不同。在上面的例子中,URL1有3个对应的新闻,URL3只有一个。在
有时URL没有相应的“news”元素:
^{pr2}$我可以很容易地找到每个URL索引和每个URL的“news”元素。在
我的问题是:是否可以将这个列表转换成一个以URL元素为键,“news”元素是list/tuple值的字典吗?
预期输出
z = {'URL1':('news1', 'news2', 'news3'),
'URL2':('news1', 'news2'),
'URL3':('news1'),
'URL4':('news1', 'news2'),
'URL5':(),
'URL6':('news1')}
我在这个post中看到过类似的问题,但它并不能解决我的问题。在
你可以这样做:
您只需使用列表中URL键的索引并获取索引之间的内容并将其分配给第一个
像这样:
输出:
^{pr2}$您可以使用
itertools.groupby
和key
函数来标识URL:输出:
^{pr2}$相关问题 更多 >
编程相关推荐