基于词典的情感分析的基本使用脚本。与labmt数据一起使用
labMTsimple的Python项目详细描述
tl;dr一个简单的labmt使用脚本
这个脚本使用机械土耳其人(labmt)的语言评估。 为语料库的幸福程度打分。创建了labmt单词列表 通过将四种来源中出现频率最高的5000个单词组合起来: 推特,纽约时报,谷歌图书,音乐歌词,然后 在亚马逊的“机械土耳其人”上为情感评分。名单是 在Dodds等人的出版物中详细描述。2011年,公共科学图书馆一号, “全球范围内幸福和信息的时间模式 网络:hedonometrics和twitter。”
给定两个语料库,脚本“storylab.py”创建一个单词移位图 说明了造成幸福差异的最主要原因 两个下士之间。下士应该很大(例如,至少 10000字)为了使差异有意义,因为这是 一袋字走近。例如,随机收集的英语 2014年1月18日星期六和2014年1月21日星期二的推文 包含在“example”目录中。它们可以通过移动来进行比较 到测试目录,使用命令
pythonexample.pyexample-shift.html
并在web浏览器中打开文件example-shift.html。为了一个 对结果图的解释,请访问
http://www.hedonometer.org/shifts.html
安装
建议直接克隆github,即
git clone https://github.com/andyreagan/labMT-simple.git
然后使用
sudo python setup.py install
可以通过导航到test目录并运行来运行测试
python test.py
它将比较test/data和print test.html中的两天 移动它们,让镜头可以改变。
也可以使用pip安装此存储库
pip install labMTsimple
在这种情况下,如果 渴望的。