BioLearns:计算生物学和Python中的生物信息学工具箱

biolearns的Python项目详细描述


生物学习

BioLearns:计算生物学和生物信息学工具箱

license

安装

  • 来自PyPI
pip install biolearns -U

文档和教程

  • 我们选择下面列出的三个例子。有关教程的完整列表,请查看我们的github wiki页面:

    Wiki

免责声明

请注意,这是BioLearns的预发布版本,在正式发布之前仍在进行最终测试。本网站、其软件和网站上的所有内容都是按“原样”和“可用”提供的。BioLearns对网站、其软件或其任何内容的适用性或可用性不作任何明示或暗示的保证。BioLearns对任何一方因使用图书馆或内容而遭受的任何损失概不负责,无论此类损失是直接的、间接的、特殊的还是间接的。任何使用图书馆的风险由用户自行承担,用户将对任何计算机系统的损坏或因此类活动造成的数据丢失承担全部责任。如果您在网站上遇到任何错误、故障、功能缺失或其他问题,请立即通知我们,以便我们能够相应地进行纠正。非常感谢你在这方面的帮助。在

1。读取TCGA数据

示例:读取TCGA乳腺浸润癌(BRCA)数据

数据直接从https://gdac.broadinstitute.org/下载。 这里的结果全部或部分基于 TCGA研究网络:https://www.cancer.gov/tcga。在

^{pr2}$
brca=TCGA('BRCA')mRNAseq=brca.mRNAseqclinical=brca.clinical

TCGA癌症表快捷方式:

BarcodeCancer full nameVersion
1ACCAdrenocortical carcinoma2016_01_28
2BLCABladder urothelial carcinoma2016_01_28
3BRCABreast invasive carcinoma2016_01_28
4CESCCervical and endocervical cancers2016_01_28
5CHOLCholangiocarcinoma2016_01_28
6COADColon adenocarcinoma2016_01_28
7COADREADColorectal adenocarcinoma2016_01_28
8DLBCLymphoid Neoplasm Diffuse Large B-cell Lymphoma2016_01_28
9ESCAEsophageal carcinoma2016_01_28
............

2。基因共表达分析

我们首先下载并访问mRNAseq数据。在

frombiolearns.datasetimportTCGAbrca=TCGA('BRCA')mRNAseq=brca.mRNAseq

mRNAseq数据有噪声。我们筛选出平均值最低的50%基因,然后筛选出方差值最低的剩余基因50%。在

frombiolearns.preprocessingimportexpression_filtermRNAseq=expression_filter(mRNAseq,meanq=0.5,varq=0.5)

然后我们使用lmQCM类创建一个lmQCM对象lobj。在

基因共表达分析只需调用fit()函数即可。在

frombiolearns.coexpressionimportlmQCMlobj=lmQCM(mRNAseq)clusters,genes,eigengene_mat=lobj.fit()

3。单变量生存分析

我们首先下载并访问mRNAseq数据。以乳腺癌为例。在

frombiolearns.datasetimportTCGAbrca=TCGA('BRCA')mRNAseq=brca.mRNAseq

我们从生存子包中导入logranktest。选择基因ABLIM3作为单变量输入。在

frombiolearns.survivalimportlogranktestr=mRNAseq.loc['ABLIM3',].values

我们找到了单变量、时间和事件数据的交集

bcd_m=[b[:12]forbinmRNAseq.columns]bcd_p=[b[:12]forbinclinical.index]bcd=np.intersect1d(bcd_m,bcd_p)r=r[np.nonzero(np.in1d(bcd,bcd_m))[0]]t=brca.overall_survival_time[np.nonzero(np.in1d(bcd,bcd_p))[0]]e=brca.overall_survival_event[np.nonzero(np.in1d(bcd,bcd_p))[0]]

我们进行日志等级测试:

logrank_results,fig=logranktest(r[~np.isnan(t)],t[~np.isnan(t)],e[~np.isnan(t)])test_statistic,p_value=logrank_results.test_statistic,logrank_results.p_value

输出数据如下:

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java为什么即使我已经给出了代码中的所有权限,该代码也没有在emulator中运行?   java Android Studio正在抛出“线程中的异常”main“javax.net.ssl.SSLException:收到致命警报:协议\版本”   java中的for循环嵌套foreach语句   java读取/src/main/resources和/webinf/classes下的文件   java无法以此格式构造JSON响应   身份验证尝试从CAS secure rest api获取响应,但从java客户端获取登录页面作为响应   如何在java中使用excel从第1列和第3列获取单元格值,并将其作为键值对放入map中   在Java程序中打开Windows虚拟键盘   java有没有递归调用findMatch的方法?   java Pig脚本/命令,用于根据多个字符串筛选文件   java最小数量应匹配,应与POST匹配   java打开/关闭声音按钮不工作   Java嵌入式数据库持久性   java在方法调用时引发异常   java文本文件被覆盖而不是保存的问题   java Hibernate sql注释