德语情感分类的python包。

germansentiment的Python项目详细描述


德国情绪分类与伯特

这个包为德语文本的detect the sentiment提供了一个非常简单的接口。它使用Googles-Bert架构,对183.4万个样本进行了训练。培训数据包含来自不同领域的文本,如Twitter、Facebook和电影、应用程序和酒店评论。您可以在paper中找到有关数据集和培训过程的更多信息。在

安装

要开始从pypi安装包:

pip install germansentiment

使用

^{pr2}$

上面的代码将输出以下列表:

["negative","negative","positive","positive","neutral","neutral"]

结果

如果您对用于训练此模型的代码和数据感兴趣,请查看this repository和我们的paper。下面是他的模型在以下数据集上获得的F1分数表。因为我们在一个新版本的transformer库上训练了这个模型,结果比本文报道的稍好一些。在

DatasetF1 micro Score
holidaycheck0.9568
scare0.9418
filmstarts0.9021
germeval0.7536
PotTS0.6780
emotions0.9649
sb10k0.7376
Leipzig Wikipedia Corpus 20160.9967
all0.9639

引用

如需反馈和问题,请通过电子邮件或Twitter联系我@oliverguhr。如果您觉得有用,请引用我们:

@InProceedings{guhr-EtAl:2020:LREC,
  author    = {Guhr, Oliver  and  Schumann, Anne-Kathrin  and  Bahrmann, Frank  and  Böhme, Hans Joachim},
  title     = {Training a Broad-Coverage German Sentiment Classification Model for Dialog Systems},
  booktitle      = {Proceedings of The 12th Language Resources and Evaluation Conference},
  month          = {May},
  year           = {2020},
  address        = {Marseille, France},
  publisher      = {European Language Resources Association},
  pages     = {1620--1625},
  url       = {https://www.aclweb.org/anthology/2020.lrec-1.202.pdf}
}

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java在Hibernate中使用条件连接两个表?   Stripes框架中的java对话范围   我的内存够吗?   Jenkins Java&Selenium如何处理2个随机异常?   javascript Java websockets跨端点共享会话   java是一种测试驱动的开发方法吗?   Java客户端中的Soap连接超时,但在SOAPUI中未超时   Java LibGDX:TileMap未在顶部和右侧渲染   linux Java::process builder:bash脚本:返回的文件名正确,但fileReader引发FileNotFoundException   java Selenium单击自动随机生成的DIV/ID/LINK   比较两个忽略元素和属性顺序的XMl文件   Java无限循环/调用   java如何防止操作修改cookie?   列出未保存的Java webpanel命令   在Java中,如何解决XXXX不能作为变量求解的错误?   Java概念后期版本格式化部分