我有一个CSV文件(从Excel转换而来),其中有一列我感兴趣的字符串。这些字符串(大约4000个)由4个字符到22个字符的不同长度组成,但只有4个字符(A、B、C或D)。在
我想计算4个字符(A、B、C或D)在字符串的每个位置上出现的次数。在
例如,考虑以下字符串:
ABBA, CDABB, AAAAAA
然后,在每个字符串的第一个位置,A出现两次,C出现一次。在每个字符串的第6个位置,A发生一次。在
到目前为止,我想到了解决这个问题的步骤:
或者只是迭代并计算字母在第n个位置的出现次数,然后执行字符串.lstrip()删除该字母并重复迭代。在
但是,我不知道如何操作CSV文件中的字符串,有人有什么提示吗?在
^{pr2}$[zip(y, range(1, len(y)+1)) for y in x]
-根据x中每个元素的位置创建一对(A,0),(B,1)等。因此我们得到-chain-将所有这些列表链接到一个列表中,Counter是Counter类的构造函数,它实际上是一个字典,它计算每个值出现的次数。在
您可以使用https://docs.python.org/2/library/csv.html从csv文件读取数据
相关问题 更多 >
编程相关推荐