用于语言研究和字词计数的开源库(LIWC)
2 个回答
-7
你可能会觉得Python的自然语言工具包(NLTK)很有用:http://www.nltk.org/
2
正如ealdent提到的,LIWC既是一个软件,也是一个数据集。这个数据集是专有的,所以没有开源版本。至于软件方面,TAWC是一个很有用的开源Perl版本。从评论中可以了解到:
这是一个稍微复杂的脚本,改编自我在CHI论文中使用的那个。这个脚本的任务是从一个字典中读取正则表达式(如果不是正则表达式的话,就把它们转换成正则表达式),这些表达式必须与LIWC软件集向后兼容(可以参考http://www.liwc.net)。然后它会计算每一行输入/用户中正则表达式的匹配次数,并将结果输出给该行/用户。
你还可以购买LIWClite,它的价格不到LIWC的一半。你也可以免费使用TAWC和你自己的字典。