我有一个矩阵,我试图生成文本语料库
chewbacca darth han leia luke obi
chewbacca 0 0 0 0 0.66 0.33
darth 0 0 0 1 0 0
han 0 0 0 0 1 0
leia 0 0 0 0 1 0
luke 0 0 0 0 0 0
obi 0 0 0 0 0 0
我选择作品《丘巴卡》作为我的第一个词
现在我正试图根据概率为丘巴卡找到配对。这里有两个词-luke(0.66)和obi(0.33)
第二个词必须基于加权概率
例如,如果“卢克”对的“丘巴卡”为0.66,“欧比”对的“丘巴卡”为0.33,“卢克”的选择概率必须是“欧比”的两倍
如何处理?谢谢你的建议
如果您想创建一个Bigram语料库:
示例输出:
相关问题 更多 >
编程相关推荐