正如标题所说,我试图在某些条件下对数据帧的每对列应用一个函数。我将试着说明这一点。我的测向格式是:
Code | 14 | 17 | 19 | ...
w1 | 0 | 5 | 3 | ...
w2 | 2 | 5 | 4 | ...
w3 | 0 | 0 | 5 | ...
代码对应于矩形网格中确定的位置,ws是不同的单词。我只想在每对列之间应用余弦相似性度量(已编辑!)如果对中某一列中的项之和大于5。在
预期输出如下:
^{pr2}$
cs是每对列的余弦相似性的结果。
有什么合适的方法来做这件事吗?在
如有任何帮助,我们将不胜感激:-)
Tags:
要将余弦度量应用于来自两个输入集合的每个对,您可以 可以使用^{} 。这将比
使用双Python循环。在
{让所有列中的一列。让另一个集合仅为总和大于5的列:
然后,只需调用
^{pr2}$cdist
,就可以计算出所有的余弦相似性:可以将这些值包装在新的数据帧中并重新调整形状:
^{3}$生成序列
相关问题 更多 >
编程相关推荐