总结与python的重叠

2024-04-23 14:57:02 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在用python分析DNA/蛋白质序列数据,遇到了一个问题。 这是DNA序列表。你知道吗

enter image description here

我想把它们分析为group1和group2是成对的。 例如,AAATTT\u TTTCCC或GGGCCC\u GGAAA是成对的。你知道吗

这个序列数据有时显示相同的序列。 例如,aaatt出现了三次,AGTC出现了两次。 我想计算这个重叠序列并总结如下。 我想我应该用熊猫,但不知道怎么做。 如果有人能帮上忙,我会非常感激的。你知道吗

enter image description here


Tags: 数据序列蛋白质dna我会序列表group1group2
1条回答
网友
1楼 · 发布于 2024-04-23 14:57:02

要计算列中每个唯一值的出现次数,请执行以下操作:

# import pandas
import pandas as pd

# load data into Pandas dataframe
df = pd.read_csv("data.csv")

# get counts for each unique Group1 value
df["Group1"].value_counts()

相关问题 更多 >