基于sqlalchemy的负鼠转录因子结合数据库接口。

pyopossum3的Python项目详细描述


https://travis-ci.org/konstantint/pyopossum3.png?branch=master:target:https://travis-ci.org/konstantint/pyopossum3

该包为oPOSSUM3原始数据库表提供了一个面向对象的访问接口。

安装

安装包的最简单方法是通过easy_installpip

$ easy_install pyopossum3

依赖关系

用法

用法示例如下:

>>> from pyopossum3 import Opossum
>>> o = Opossum("mysql+pymysql://opossum_r:@opossum.cmmt.ubc.ca/oPOSSUM3_human")
>>> o.ConservedTfbs.query.first().gene
>>> o.ExternalGeneId.query.filter(o.ExternalGeneId.external_id.in_(['TSPAN6'])).filter(o.ExternalGeneId.gene.has(chr='X')).first().gene
... etc ...

第二行创建到负鼠服务器的连接,第三/第四行使用sqlalchemy语法查询conserved_tfbssexternal_gene_ids表。

当然,对于繁重的分析,建议您建立自己的数据库副本。 有关如何下载数据的说明,请参见here

您可以通过运行以下命令来了解数据库的结构:

>>> for cls in o.all_orm_classes:
>>>    print cls.query.first()

您可能应该关心的主表是ConservedTfbs,它包含每个基因附近的匹配项,并用匹配分数和保存级别进行注释。

使用ucscgenome包验证tfbs序列是否确实正确的示例:

>>> c = o.ConservedTfbs.query.filter(o.ConservedTfbs.strand==1).first()
>>> c.gene.chr, c.absolute_start, c.absolute_end, c.seq
('X', 99890235L, 99890253L, 'AGAAACATTGCATACTGC')
>>> from ucscgenome import Genome
>>> g = Genome('hg19')
>>> g['chrX'][99890235:99890253]
'AGAAACATTGCATACTGC'

此软件包的作者与负鼠工具的创建者和维护者无关。

另请参见

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java使用Eclipse Helios for Web项目   java指定行。作为编译器设置的分隔符?   osm映射中带有osmdroid的java标记   java Android ClassNotFoundException在路径:DexPathList上未找到类   java从j2me调用GWT方法   更新到java 8后的aspectj问题   如何仅从根元素java,com提取文本内容。滴虫软件。是的。html   安卓公司。谷歌。火基。数据库DatabaseException:未能转换java类型的值。将字符串改为长字符串   从java中的方法返回arraylist变量   java如果将引用重新分配给同步块内的锁对象,会是什么?   java下载。使用spring mvc的资源文件中的xlsx文件   java Eclipse提供了什么工具来运行Eclipse中未包含的程序?   spring boot Java泛型如何读取传递给泛型方法的类型上的字段或调用方法   Javacard中的javaecdsa签名