用于语言研究和字词计数的开源库(LIWC)

14 投票
2 回答
11989 浏览
提问于 2025-04-15 20:49

我在找一个开源的库,用于语言探究和词汇计数,叫做 (LIWC)。如果有Java或Python的版本就最好了,不过我也愿意尝试其他语言。

有没有人知道我可以在哪里找到这样的库呢?

谢谢!

2 个回答

-7

你可能会觉得Python的自然语言工具包(NLTK)很有用:http://www.nltk.org/

2

正如ealdent提到的,LIWC既是一个软件,也是一个数据集。这个数据集是专有的,所以没有开源版本。至于软件方面,TAWC是一个很有用的开源Perl版本。从评论中可以了解到:

这是一个稍微复杂的脚本,改编自我在CHI论文中使用的那个。这个脚本的任务是从一个字典中读取正则表达式(如果不是正则表达式的话,就把它们转换成正则表达式),这些表达式必须与LIWC软件集向后兼容(可以参考http://www.liwc.net)。然后它会计算每一行输入/用户中正则表达式的匹配次数,并将结果输出给该行/用户。

你还可以购买LIWClite,它的价格不到LIWC的一半。你也可以免费使用TAWC和你自己的字典。

撰写回答