我是一名生物系的学生,在实验室里我们正在老鼠身上测试某种药物。在正常状态下,我们有多组生物复制的基因表达数据:
gene replicate 1 replicate2
gene1 -0.842138 -0.701153
gene2 -0.796896 -0.725085
gene3 -0.835920 -0.707572
gene5 -0.702721 -0.724579
gene6 -0.815476 -0.737112
....
gene 20000
each dot represent a gene
在给它们喂药后,我们得到了一个新的基因表达数据: after medicine treatment
我的问题是,我怎样才能把那些真正受影响的基因从那些仅仅是生物变异(复制之间的差异)的基因中分离出来
我是机器学习的新手,我相信监督学习应该是我的选择,对吧?训练数据是我的复制数据,然后我可以测试药物治疗后的每个基因是否能落入复制定义的“耐受区”。但我不知道该用哪种方法。如有任何指导,请提前告知
首先欢迎使用堆栈溢出!其次,我真的认为这个问题应该移到这里:DataScience或Artificial Intelligence。尽管如此,我还是会尽力帮你找到答案
我有几个问题,当你回答的时候,你应该走上正确的道路来解决这个问题:
我个人会计算这些基因的平均值和标准差,并在引入药物后做同样的事情。这将帮助您了解边界是如何变化的,以及最有可能发生扩散的位置。另外,如果你有选择的话,一定要使用EDA(我知道我在这方面很说教,但它很有帮助)。我认为这将有助于你更好地了解你的问题。我希望我能帮上忙
算法的有用链接:Machine Learning Algorithms
相关问题 更多 >
编程相关推荐