获取二元概率(python)

2024-04-27 16:47:07 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图写一个计算二元概率的函数。在

所以,我基本上要计算两个连续词在语料库中的出现率,然后除以这两个词的第一个词。在

公式中为:

p(W_n-1,W_n)/p(W_n-1)

所以在我的代码中,我试图做一些类似的事情:

def prob(self, prevWord, word):
    word = word.strip()
    prevWord = prevWord.strip()
    for sen in corpus:
        for word in sen:
            if(word occurs after prevWord): #Pseudocode here
                  counter++
    numerator = counter / self.total
    prevWordProb = self.counts[prevWord]/self.total
    return numerator / prevWordProb

首先,我的方法有效吗?如果是这样,我不知道如何编写

^{pr2}$

代码的一部分。会是什么样子?在


Tags: 函数代码inselfforcounter概率word