生物变异或真正受影响的基因。

2024-05-13 20:02:43 发布

您现在位置:Python中文网/ 问答频道 /正文

我是一名生物系的学生,在实验室里我们正在老鼠身上测试某种药物。在正常状态下,我们有多组生物复制的基因表达数据: gene replicate 1 replicate2 gene1 -0.842138 -0.701153 gene2 -0.796896 -0.725085 gene3 -0.835920 -0.707572 gene5 -0.702721 -0.724579 gene6 -0.815476 -0.737112 .... gene 20000 each dot represent a gene

在给它们喂药后,我们得到了一个新的基因表达数据: after medicine treatment

我的问题是,我怎样才能把那些真正受影响的基因从那些仅仅是生物变异(复制之间的差异)的基因中分离出来

我是机器学习的新手,我相信监督学习应该是我的选择,对吧?训练数据是我的复制数据,然后我可以测试药物治疗后的每个基因是否能落入复制定义的“耐受区”。但我不知道该用哪种方法。如有任何指导,请提前告知


Tags: 数据状态基因生物实验室学生药物老鼠
1条回答
网友
1楼 · 发布于 2024-05-13 20:02:43

首先欢迎使用堆栈溢出!其次,我真的认为这个问题应该移到这里:DataScienceArtificial Intelligence。尽管如此,我还是会尽力帮你找到答案

我有几个问题,当你回答的时候,你应该走上正确的道路来解决这个问题:

  1. 您是如何将数据拆分为培训数据的(用于培训的数据占总数据的百分比是多少)
  2. 你是否为最初引入化学物质的基因建立了界限
  3. 你最初期望的变化是什么
  4. 检验完成后,方差的边界是否有显著变化
  5. 对于这个特定的问题,你想用什么算法
  6. 你打算用EDA来获得更好的洞察力吗
  7. 你有没有想过用K-means来观察“新药”推出后数据簇的变化

我个人会计算这些基因的平均值和标准差,并在引入药物后做同样的事情。这将帮助您了解边界是如何变化的,以及最有可能发生扩散的位置。另外,如果你有选择的话,一定要使用EDA(我知道我在这方面很说教,但它很有帮助)。我认为这将有助于你更好地了解你的问题。我希望我能帮上忙

算法的有用链接:Machine Learning Algorithms

相关问题 更多 >