德语情感分类的python包。
germansentiment的Python项目详细描述
德国情绪分类与伯特
这个包为德语文本的detect the sentiment提供了一个非常简单的接口。它使用Googles-Bert架构,对183.4万个样本进行了训练。培训数据包含来自不同领域的文本,如Twitter、Facebook和电影、应用程序和酒店评论。您可以在paper中找到有关数据集和培训过程的更多信息。在
安装
要开始从pypi安装包:
pip install germansentiment
使用
^{pr2}$上面的代码将输出以下列表:
["negative","negative","positive","positive","neutral","neutral"]
结果
如果您对用于训练此模型的代码和数据感兴趣,请查看this repository和我们的paper。下面是他的模型在以下数据集上获得的F1分数表。因为我们在一个新版本的transformer库上训练了这个模型,结果比本文报道的稍好一些。在
Dataset | F1 micro Score |
---|---|
holidaycheck | 0.9568 |
scare | 0.9418 |
filmstarts | 0.9021 |
germeval | 0.7536 |
PotTS | 0.6780 |
emotions | 0.9649 |
sb10k | 0.7376 |
Leipzig Wikipedia Corpus 2016 | 0.9967 |
all | 0.9639 |
引用
如需反馈和问题,请通过电子邮件或Twitter联系我@oliverguhr。如果您觉得有用,请引用我们:
@InProceedings{guhr-EtAl:2020:LREC,
author = {Guhr, Oliver and Schumann, Anne-Kathrin and Bahrmann, Frank and Böhme, Hans Joachim},
title = {Training a Broad-Coverage German Sentiment Classification Model for Dialog Systems},
booktitle = {Proceedings of The 12th Language Resources and Evaluation Conference},
month = {May},
year = {2020},
address = {Marseille, France},
publisher = {European Language Resources Association},
pages = {1620--1625},
url = {https://www.aclweb.org/anthology/2020.lrec-1.202.pdf}
}
- 项目
标签: