实际上我有这样一个条目:
(observatório=astronómico, de o, universidade=de=coimbra)
(centro=de=astronomia, de o, universidade=do=porto=catarina=lobo)
(núcleo=interactivo=de=astronomia, em o, centro=de=interpretação=ambiental=da=ponta=do=sal)
(câmara=municipal, de, cascais)
(câmara, de, nova=iorque)
(presidência, de o, pe)
(fortis, em, bruxelas)
(macquarie=futures, de o, eua)
(força=internacional=de=assistência=e=segurança, constituir o, força=de=reacção=rápida=do=comandante)
(forças=nacionais=destacadas, em o, afeganistão)
(nato, em o, afeganistão)
(nato, em o, afeganistão)
并且需要计算一个字符串重复的次数,并将其输出到另一个.txt。我是用dict写的,但是很沮丧。去掉特殊字符。在
^{pr2}$关于如何正确地计算它,并以任何人都可以读取并知道一个字符串(由于条目格式,可以是一行)发生了多少次的方式输出它?在
由于您的文本文件不包含提取单词所需的单词字符,为此,您可以使用
regex
,然后可以使用collections.Counter
来获取包含单词频率的字典:\w+
将匹配长度为1或更多的单词字符的任何组合!在对于特定单词的计数,您可以使用
^{pr2}$list.count()
方法:相关问题 更多 >
编程相关推荐