我有一套单词
{'DNA',
'pada',
'yang',...}
我试图找出集合中的单词是否在下面的bigram数据框中有单词对
bigramf freq
0 (DNA, yang) 15
1 (DNA, dalam) 6
2 (DNA, ini) 5
3 (DNA, memiliki) 4
4 (DNA, unting) 4
5 (pada, DNA) 4
6 (pada, urutan) 3
7 (yang, diperoleh) 3
8 (yang, lebih) 3
9 (pada, sejumlah) 2
10 (pada, RNA) 2
11 (pada, satu) 2
12 (yang, berbeda) 2
13 (yang, sama) 2
14 (yang, tumpang) 2
如果是,则预期输出如下:
yang [('lebih', 3), ('diperoleh', 3), ('berbeda', 2), ('tumpang', 2), ('sama', 2)]
DNA [('yang', 15), ('dalam', 6), ('ini', 5), ('memiliki', 4), ('unting', 4)]
pada [('DNA', 4), ('urutan', 3), ('sejumlah', 2), ('RNA', 2), ('satu', 2)]
我怎么找到?。有人能帮忙吗?谢谢非常感谢您的帮助
首先将具有元组的列转换为新的2列(不要使用} ),然后按^{} 中的^{} 筛选匹配的值,并将^{} 中的值转换为元组列表:
apply(pd.Series)
,因为^{如果需要,请添加^{} :
使用^{} 的另一种解决方案:
我所做的是匹配单词
我循环遍历数据帧,获取每个元素,并将其传递给像这样的def
相关问题 更多 >
编程相关推荐