短文本情感分类任务所需的最小训练集大小是多少

2024-05-12 16:44:14 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试训练一个LSTM模型,用于短文本(如产品评论和tweets)的情感分类任务。在

我正在寻找一个训练集,标签积极/消极/中立,有没有这样的东西(免费研究)是真正基于人类标签,而不是开始或表情符号?Iv'e只找到了一些小的训练集,结果我的成绩很差。Iv'e试图增加我的网络规模和层叠,但没有改善。在

为了开始获得合理的结果,这种训练集的最小大小是多少(F1>;0.8)。在


Tags: 模型网络产品评论分类标签人类tweets
1条回答
网友
1楼 · 发布于 2024-05-12 16:44:14

你真的只需要列出100个左右,每一个,消极和积极的形容词。在

请参见:
http://na2english.wikispaces.com/file/view/ADJECTIVES%20TO%20DESCRIBE%20FILMS.pdf/400672720/ADJECTIVES%20TO%20DESCRIBE%20FILMS.pdf

http://arxiv.org/ftp/arxiv/papers/1011/1011.4623.pdf

很明显,如果你使用它们的话,可以引用它们,但是语言是免费的,所以你可以在工作中使用它们。在

可能比构建数据库的大小更重要的是选择针对特定应用程序的单词,以提高效率。在

你的目标是为了一个特定的商业用途还是作为一个更广泛的研究工作?在

相关问题 更多 >