用于计算词汇重叠分数的函数
lexicon-overlap-score的Python项目详细描述
词汇重叠分数
词汇重叠分数是情感词汇在情感分类中的一种相似性度量。在
安装
通过pip install lexicon_overlap_score
安装
使用
通过import lexicon_overlap_score as los
导入
你的词典应该是一个pandas数据框架,其中有word
和{
los.simple(lex1,lex2)los.binary(lex1,lex2)los.score(lex1,lex2)
simple
和binary
返回0到1之间的值,而score
返回介于-1和1之间的值。
函数期望正的词有正的值,负的词有负的值。在
如果您的词典是一个python字典,将单词映射为值,请将其转换为pandas数据帧。在
^{pr2}$示例
import pandas as pd
import lexicon_overlap_score as los
df1 = pd.DataFrame([("test", 1), ("free", 1), ("other", 1), ("check", 0.5)], columns=["word", "so"])
df2 = pd.DataFrame([("test", 0.5), ("free", 1)], columns=["word", "so"])
los.simple(df1, df2), los.binary(df1, df2), los.score(df1, df2)
- 项目
标签: