我有一个数据框架,其中一列包含单词和计数字典,另一列包含标签
|dict |label |
|-------------------------|--------|
|{'word1':1, 'word2':2} |1 |
|{'word2':4, 'word3':1} |0 |
|{'word1':3, 'word4':2} |0 |
|-------------------------|--------|
我需要输出所有单词、它们的计数和它们的平均标签(按计数加权):
|word |count |average|
|-------|-------|-------|
|word1 |4 |0.25 |
|word2 |6 |0.33 |
|word3 |1 |0.0 |
|word4 |2 |0.0 |
|-------|-------|-------|
为了澄清平均值:对于word1
,有一个实例的标签为1
,第3行有三个实例的标签为0
,因此平均值为1/4=0.25
我很难访问循环中的两个不同列。这本字典也让我很反感,我有点像python的书呆子,所以非常感谢您的帮助
给你:
我首先重新构造数据,然后使用求和和和除法函数得到平均值
相关问题 更多 >
编程相关推荐