BioLearns:计算生物学和Python中的生物信息学工具箱
biolearns的Python项目详细描述
生物学习
BioLearns:计算生物学和生物信息学工具箱
安装
- 来自PyPI
pip install biolearns -U
文档和教程
- 在
我们选择下面列出的三个例子。有关教程的完整列表,请查看我们的github wiki页面:
在
免责声明
请注意,这是BioLearns的预发布版本,在正式发布之前仍在进行最终测试。本网站、其软件和网站上的所有内容都是按“原样”和“可用”提供的。BioLearns对网站、其软件或其任何内容的适用性或可用性不作任何明示或暗示的保证。BioLearns对任何一方因使用图书馆或内容而遭受的任何损失概不负责,无论此类损失是直接的、间接的、特殊的还是间接的。任何使用图书馆的风险由用户自行承担,用户将对任何计算机系统的损坏或因此类活动造成的数据丢失承担全部责任。如果您在网站上遇到任何错误、故障、功能缺失或其他问题,请立即通知我们,以便我们能够相应地进行纠正。非常感谢你在这方面的帮助。在
1。读取TCGA数据
示例:读取TCGA乳腺浸润癌(BRCA)数据
数据直接从https://gdac.broadinstitute.org/下载。 这里的结果全部或部分基于 TCGA研究网络:https://www.cancer.gov/tcga。在
^{pr2}$brca=TCGA('BRCA')mRNAseq=brca.mRNAseqclinical=brca.clinical
TCGA癌症表快捷方式:
Barcode | Cancer full name | Version | |
---|---|---|---|
1 | ACC | Adrenocortical carcinoma | 2016_01_28 |
2 | BLCA | Bladder urothelial carcinoma | 2016_01_28 |
3 | BRCA | Breast invasive carcinoma | 2016_01_28 |
4 | CESC | Cervical and endocervical cancers | 2016_01_28 |
5 | CHOL | Cholangiocarcinoma | 2016_01_28 |
6 | COAD | Colon adenocarcinoma | 2016_01_28 |
7 | COADREAD | Colorectal adenocarcinoma | 2016_01_28 |
8 | DLBC | Lymphoid Neoplasm Diffuse Large B-cell Lymphoma | 2016_01_28 |
9 | ESCA | Esophageal carcinoma | 2016_01_28 |
... | ... | ... | ... |
2。基因共表达分析
我们首先下载并访问mRNAseq数据。在
frombiolearns.datasetimportTCGAbrca=TCGA('BRCA')mRNAseq=brca.mRNAseq
mRNAseq数据有噪声。我们筛选出平均值最低的50%基因,然后筛选出方差值最低的剩余基因50%。在
frombiolearns.preprocessingimportexpression_filtermRNAseq=expression_filter(mRNAseq,meanq=0.5,varq=0.5)
然后我们使用lmQCM类创建一个lmQCM对象lobj
。在
基因共表达分析只需调用fit()
函数即可。在
frombiolearns.coexpressionimportlmQCMlobj=lmQCM(mRNAseq)clusters,genes,eigengene_mat=lobj.fit()
3。单变量生存分析
我们首先下载并访问mRNAseq数据。以乳腺癌为例。在
frombiolearns.datasetimportTCGAbrca=TCGA('BRCA')mRNAseq=brca.mRNAseq
我们从生存子包中导入logranktest。选择基因ABLIM3作为单变量输入。在
frombiolearns.survivalimportlogranktestr=mRNAseq.loc['ABLIM3',].values
我们找到了单变量、时间和事件数据的交集
bcd_m=[b[:12]forbinmRNAseq.columns]bcd_p=[b[:12]forbinclinical.index]bcd=np.intersect1d(bcd_m,bcd_p)r=r[np.nonzero(np.in1d(bcd,bcd_m))[0]]t=brca.overall_survival_time[np.nonzero(np.in1d(bcd,bcd_p))[0]]e=brca.overall_survival_event[np.nonzero(np.in1d(bcd,bcd_p))[0]]
我们进行日志等级测试:
logrank_results,fig=logranktest(r[~np.isnan(t)],t[~np.isnan(t)],e[~np.isnan(t)])test_statistic,p_value=logrank_results.test_statistic,logrank_results.p_value
输出数据如下:
- 项目
标签: