生物变异或真正受影响的基因。 - 问答 - Python中文网

生物变异或真正受影响的基因。

2024-05-13 20:02:43 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我是一名生物系的学生，在实验室里我们正在老鼠身上测试某种药物。在正常状态下，我们有多组生物复制的基因表达数据： gene replicate 1 replicate2 gene1 -0.842138 -0.701153 gene2 -0.796896 -0.725085 gene3 -0.835920 -0.707572 gene5 -0.702721 -0.724579 gene6 -0.815476 -0.737112 .... gene 20000each dot represent a gene

在给它们喂药后，我们得到了一个新的基因表达数据： after medicine treatment

我的问题是，我怎样才能把那些真正受影响的基因从那些仅仅是生物变异（复制之间的差异）的基因中分离出来

我是机器学习的新手，我相信监督学习应该是我的选择，对吧？训练数据是我的复制数据，然后我可以测试药物治疗后的每个基因是否能落入复制定义的“耐受区”。但我不知道该用哪种方法。如有任何指导，请提前告知

Tags：数据状态基因生物实验室学生药物老鼠

1条回答

网友

1楼 · 发布于 2024-05-13 20:02:43

首先欢迎使用堆栈溢出！其次，我真的认为这个问题应该移到这里：DataScience或Artificial Intelligence。尽管如此，我还是会尽力帮你找到答案

我有几个问题，当你回答的时候，你应该走上正确的道路来解决这个问题：

您是如何将数据拆分为培训数据的（用于培训的数据占总数据的百分比是多少）
你是否为最初引入化学物质的基因建立了界限
你最初期望的变化是什么
检验完成后，方差的边界是否有显著变化
对于这个特定的问题，你想用什么算法
你打算用EDA来获得更好的洞察力吗
你有没有想过用K-means来观察“新药”推出后数据簇的变化

我个人会计算这些基因的平均值和标准差，并在引入药物后做同样的事情。这将帮助您了解边界是如何变化的，以及最有可能发生扩散的位置。另外，如果你有选择的话，一定要使用EDA（我知道我在这方面很说教，但它很有帮助）。我认为这将有助于你更好地了解你的问题。我希望我能帮上忙

算法的有用链接：Machine Learning Algorithms

相关问题更多 >

编程相关推荐

热门问题

热门文章