我试图写一个计算二元概率的函数。在
所以,我基本上要计算两个连续词在语料库中的出现率,然后除以这两个词的第一个词。在
公式中为:
p(W_n-1,W_n)/p(W_n-1)
所以在我的代码中,我试图做一些类似的事情:
def prob(self, prevWord, word):
word = word.strip()
prevWord = prevWord.strip()
for sen in corpus:
for word in sen:
if(word occurs after prevWord): #Pseudocode here
counter++
numerator = counter / self.total
prevWordProb = self.counts[prevWord]/self.total
return numerator / prevWordProb
首先,我的方法有效吗?如果是这样,我不知道如何编写
^{pr2}$代码的一部分。会是什么样子?在
代码还有一些其他问题,但如果解决了,循环和条件应该类似于:
相关问题 更多 >
编程相关推荐