好吧
awessome的Python项目详细描述
很好
一个嵌入许多情绪的情绪记分器(AWESSOME)是一个框架 预测句子情感强度的目的。在
一个靠感情种子词和文字植入, 其中两个句子的向量表示之间的相似性被认为是 反映了他们感情上的相似性。在
AWESSOME利用已有的词典([VADER](https://github.com/cjhutto/vaderSentiment), [LabMT](https://trinker.github.io/qdapDictionaries/labMT.html)),但也可以使用自定义词典,并使用AWESSOME创建。在
AWESSOME还借鉴了语言模型的最新进展,通过使用HuggingFace中的Transformers,使用BERT、RoBERTa等创建单词嵌入
AWESSOME是可伸缩的,不需要任何训练数据,同时提供更细粒度(和准确的)情感强度得分的单词,短语和文本。在
引文信息
如果你在研究中使用了一些情绪分析工具,请引用下面的文章。例如:
Htait, A. & Azzopardi, L. (2020). …… 2020.
安装
要安装AWESSOME,请执行以下操作:
- 最简单的方法是使用命令行使用pip从[PyPI]进行安装,例如pip install awessome
- 如果您已经有了AWESSOME并且只需要升级到最新版本,例如pip install–upgrade AWESSOME
- 您还可以克隆这个[GitHub repository]:https://github.com/cumulative-revelations/awessome
- 您可以下载并解压缩[full master branch zip file]:https://github.com/cumulative-revelations/awessome/archive/master.zip
除了awessomepython模块之外,您还将下载两个词典字典([VADER](https://github.com/cjhutto/vaderSentiment), [标签](https://trinker.github.io/qdapDictionaries/labMT.html))。在
Python演示和代码示例
AWESSOME框架可以灵活地适应不同的种子词汇和不同的神经单词嵌入模型,从而生成特定于语料库的词汇,而不需要进行广泛的监督学习和再培训。在
通过参数,AWESSOME可以:
- 在不同的预训练语言模型之间进行选择,例如:BERT(BERT-basenli-mean-tokens)和Distilbert(Distilbert-base-nli-stsb-mean-tokens) 注意:一些预先训练过的语言模型需要GPU。在
- 对种子列表中每个词的句子相似度采用不同的聚合方法:平均值(avg)、最大值(max)和和和(Sum)。在
- 选择[scipy](https://www.scipy.org/)提供的两种可能的相似性度量之一:余弦和欧几里得。 注:如果没有提供相似性度量,则余弦作为默认度量。在
- 选择一个正种子和负种子列表的源,用户可以在其中提供新的词典文件,或者使用预先构建的词典:vader或labmt(基于vader和labmt情感词典构建)。 注意:如果没有提供词典文件,vader将作为默认种子列表源应用。在
- 选择基于词典文件创建的种子列表的大小。 注意:如果没有提供大小,值500将用作默认种子列表大小。在
- 此外,AWESSOME还提供了对种子应用“加权相似性”的可能性,方法是将相似性分数乘以种子的情感得分。 用户只需选择“加权”作为真或假,就可以选择使用该功能。 注:如果未提供加权值,则默认为False。在
添加了一个示例演示,其名称为:awessome_py演示在
更改日志
0.0.1(2020年10月20日)
- First Release
- 项目
标签: