擅长:python、mysql、java
<p>听起来你只需要单词对的列表。如果是这样的话,我想你的意思是使用<code>finder.score_ngrams</code>这样:
在</p>
<pre><code>bigram_measures = nltk.collocations.BigramAssocMeasures()
finder = BigramCollocationFinder.from_words(tokens)
scores = finder.score_ngrams( bigram_measures.raw_freq )
print scores
</code></pre>
<p>还可以使用其他评分标准。听起来你只需要频率,但是其他通用ngram的评分指标在这里-<a href="http://nltk.googlecode.com/svn-/trunk/doc/api/nltk.metrics.association.NgramAssocMeasures-class.html" rel="nofollow">http://nltk.googlecode.com/svn-/trunk/doc/api/nltk.metrics.association.NgramAssocMeasures-class.html</a></p>