2024-06-07 00:44:57 发布
网友
我有下面的代码,它能够给出每个wordQ1的文档频率,现在我需要wordQ1(TF在每个文档中DocID)的DocSize和每个DocID的DocSize。在
wordQ1
TF
DocID
DocSize
数据结构如下:
FinalHash[wordQ1]={DocID: [TF,DocSize]}
我的输出应该如下所示:
文件999中的george term频率是5
非常感谢您的帮助
您可以通过改变循环方式来获取内部字典中的值。将for i in d.keys()循环替换为如下内容:
for i in d.keys()
for DocID, (TF, DocSize) in d.items(): # ...
实际上,您还没有解释要如何处理TF和DocSize值,所以我将循环的实际内容留给您。在
注意这里需要一个循环有点傻。如果您是创建正在使用的数据结构的人(而不是从某个外部源获取数据结构),您可能应该将其设计更改为单个字典(在这个级别),而不是一个字典列表,每个字典都有一个键。也就是说,您将去掉数据结构的Term_List1级别,并在该点直接获得d。在
Term_List1
d
您可以通过改变循环方式来获取内部字典中的值。将
for i in d.keys()
循环替换为如下内容:实际上,您还没有解释要如何处理
TF
和DocSize
值,所以我将循环的实际内容留给您。在注意这里需要一个循环有点傻。如果您是创建正在使用的数据结构的人(而不是从某个外部源获取数据结构),您可能应该将其设计更改为单个字典(在这个级别),而不是一个字典列表,每个字典都有一个键。也就是说,您将去掉数据结构的
Term_List1
级别,并在该点直接获得d
。在相关问题 更多 >
编程相关推荐