genorm多基因rt-qpcr规范化算法的友好实现
eleven的Python项目详细描述
蒂姆D.史密斯,[@biotmylated](https://twitter.com/biotimylated)
11是一个用于执行多基因rt-qpcr基因的python库 表达式规范化。它是 那GeNorm algorithm 由Vandesompele等人描述。2002年。
Documentation位于 文件。
我怎么用十一?
Eleven需要Python2.7。不支持早期版本。 Python3.x的支持已经在计划中了。你需要一条科学Python 包括熊猫和松鼠。如果你没有这些,你可以 安装Anaconda environment的免费版本,其中 你需要的一切。
示例分析会话如下:
# Read PCR data into a pandas DataFrame. You want a data file where each # row corresponds to a separate well, with columns for the sample name, # target name, and Cq value. NTC wells should have the sample name set to # a value like 'NTC'. >> df = pd.read_csv('my_data.csv') # If your Sample, Target, and Cq columns are called other things, they # should be renamed to Sample, Target, and Cq. >> df = df.rename(columns={'Gene': 'Target', 'Ct': 'Cq'}) # Drop the wells that are too close to the NTC for that target. >> censored = eleven.censor_background(df) # Rank your candidate reference genes. >> ranked = eleven.rank_targets(censored, ['Gapdh', 'Rn18s', 'Hprt', 'Ubc', 'Actb'], 'Control') # Normalize your data by your most stable genes and compute normalization # factors (NFs). >> nf = eleven.calculate_nf(censored, ranked.ix['Target', 0:3], 'Control') # Now, normalize all of your expression data. >> censored['RelExp'] = eleven.expression_nf(censored, nf, 'Control')
那不容易吗?这将添加每个井的相对表达式 数据帧的列。现在您可以使用常规的pandas工具 处理数据,所以 censored.groupby(['Sample','Target'])['RelExp'].aggregate(['mean','std']) 为每个目标提供了一个很好的平均值和标准差表 在每个样本中。
gapdh/actb/rn18s不够好吗?
如果你期望你的实验发生40倍的变化 针对一个“普通嫌疑犯”的参考基因可能会这么做。
但如果你对可靠地测量较小的变化感兴趣,请记住 你的成绩质量不可能比 你的正常化。至少不需要评估 在你的实验条件下最喜欢的参考基因 可能或多或少稳定的一组其他基因 你比较的系统误差是 不受控制。除非你证明你的参考基因是定量的 稳定,你没有证据你在做一个定量的 实验。
为什么是基因型?
已经提出了几种算法,并正在用于选择 候选参照系中稳定表达目标的集合 基因。genorm是一种较老且更流行的算法。一个2009 review by Vandesompele, Kubista, and Pfaffl 解释了几种标准化算法背后的数学基础 结论是“每个科学家至少应该验证 参考基因,[用于基因正常化的]实际方法较少 “关键”,因为他们给出了“高度相似的排名。”
添加其他算法不是我的首要任务,但我很乐意接受 回归测试支持的拉取请求。
我为什么要用十一?
Eleven有一个简单、干净的接口,并使用熟悉的数据结构。 而且,我认为我们是镇上唯一一个用python进行pcr分析的游戏。
R中还有其他选项; SLqPCR 可能是十一个孩子中最亲的。 qpcR做了很多 复杂的东西,但我发现它相应的神秘。But I don’t like R。
为什么叫十一?
PCR是基于扩增的。Our amplifier goes to 11.