在Python中,是否可以对两个数据集中出现的字符串进行显著性测试

2021-05-16 07:12:07 发布

您现在位置:Python中文网/ 问答频道 /正文

我有两组数据都是从不同的来源汇编的。这两组数据都包含出现频率较高的单词。我想检查两个数据集中是否都存在某个词,如果存在,是否有可能进行某种统计意义的检验,以证明该词是有意义的。你知道吗

For example:

word = 'apple'
dict1 = {'oranges': 45, 'apple': 34,...., 'x': y}
dict2 = {'apple': 165, 'orange': 12,...., 'x': y}

如果单词“apple”同时出现在两个数据集中(dict1和dict2),则计算单词apple的显著性检验。你知道吗