好吧

awessome的Python项目详细描述


很好

一个嵌入许多情绪的情绪记分器(AWESSOME)是一个框架 预测句子情感强度的目的。在

一个靠感情种子词和文字植入, 其中两个句子的向量表示之间的相似性被认为是 反映了他们感情上的相似性。在

AWESSOME利用已有的词典([VADER](https://github.com/cjhutto/vaderSentiment), [LabMT](https://trinker.github.io/qdapDictionaries/labMT.html)),但也可以使用自定义词典,并使用AWESSOME创建。在

AWESSOME还借鉴了语言模型的最新进展,通过使用HuggingFace中的Transformers,使用BERT、RoBERTa等创建单词嵌入

AWESSOME是可伸缩的,不需要任何训练数据,同时提供更细粒度(和准确的)情感强度得分的单词,短语和文本。在

引文信息

如果你在研究中使用了一些情绪分析工具,请引用下面的文章。例如:

Htait, A. & Azzopardi, L. (2020). …… 2020.

安装

要安装AWESSOME,请执行以下操作:

  1. 最简单的方法是使用命令行使用pip从[PyPI]进行安装,例如pip install awessome
  2. 如果您已经有了AWESSOME并且只需要升级到最新版本,例如pip install–upgrade AWESSOME
  3. 您还可以克隆这个[GitHub repository]:https://github.com/cumulative-revelations/awessome
  4. 您可以下载并解压缩[full master branch zip file]:https://github.com/cumulative-revelations/awessome/archive/master.zip

除了awessomepython模块之外,您还将下载两个词典字典([VADER](https://github.com/cjhutto/vaderSentiment), [标签](https://trinker.github.io/qdapDictionaries/labMT.html))。在

Python演示和代码示例

AWESSOME框架可以灵活地适应不同的种子词汇和不同的神经单词嵌入模型,从而生成特定于语料库的词汇,而不需要进行广泛的监督学习和再培训。在

通过参数,AWESSOME可以:

  1. 在不同的预训练语言模型之间进行选择,例如:BERT(BERT-basenli-mean-tokens)和Distilbert(Distilbert-base-nli-stsb-mean-tokens) 注意:一些预先训练过的语言模型需要GPU。在
  2. 对种子列表中每个词的句子相似度采用不同的聚合方法:平均值(avg)、最大值(max)和和和(Sum)。在
  3. 选择[scipy](https://www.scipy.org/)提供的两种可能的相似性度量之一:余弦和欧几里得。 注:如果没有提供相似性度量,则余弦作为默认度量。在
  4. 选择一个正种子和负种子列表的源,用户可以在其中提供新的词典文件,或者使用预先构建的词典:vader或labmt(基于vader和labmt情感词典构建)。 注意:如果没有提供词典文件,vader将作为默认种子列表源应用。在
  5. 选择基于词典文件创建的种子列表的大小。 注意:如果没有提供大小,值500将用作默认种子列表大小。在
  6. 此外,AWESSOME还提供了对种子应用“加权相似性”的可能性,方法是将相似性分数乘以种子的情感得分。 用户只需选择“加权”作为真或假,就可以选择使用该功能。 注:如果未提供加权值,则默认为False。在

添加了一个示例演示,其名称为:awessome_py演示在

更改日志

0.0.1(2020年10月20日)

  • First Release

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Android Studio:我的短信应用程序不是默认短信应用程序的选项之一   java处理字符串问题   java为什么我的程序打印“null”而不是字符串?   java为什么要创建一个无限循环?   java循环在一段时间后将布尔值更改为false?   java Android Rest Api Post 400错误请求   java调用另一个方法以获取resultset并正确关闭连接?   java我想在2d数组中添加一行   Java:我需要从outputstream中获取字节数组   C语言中Java元注释的等价物#   java如何在从web下载图像时保持原始图像的dpi?   java中基于输入值的spring boot动态值   java从请求中获取主机名   java可以复制Swing代码并在intelliJ中的designer中查看它吗   spring如何使用java配置多个ldap   安卓如何在Java中使用具有多个类似参数的JSON请求/响应循环?   java LIbGDX如何在语言更改时翻译所有文本?