基因组数据的区间树便利类

intervaltree_bio的Python项目详细描述


用于将ucsc基因组注释记录加载到一组interval tree数据结构中的便利类。

安装

安装大多数python包的最简单方法是通过easy_installpip

$ pip install intervaltree-bio

包需要intervaltree包(通常在使用pipeasy_install时自动安装)。

用法

间隔树数据结构的主要用途之一是在生物信息学中,其中 间隔与基因或基因组的其他特征相对应。

由于基因组通常由一组染色体组成,因此每个染色体都有一个单独的间隔树。 必须保留染色体。因此,您通常使用 类似于defaultdict(IntervalTree)来索引基因组特征的数据。 模块intervaltree_bio提供了一个GenomeIntervalTree数据结构,这是一个类似的便利 数据结构。除了处理基因组区间的特定方法外 提供从UCSC读取床位文件和refgene表的工具。

核心示例是从ucsc网站加载knownGene表的转录区域:

>> from intervaltree_bio import GenomeIntervalTree
>> knownGene = GenomeIntervalTree.from_table()
>> len(knownGene)

然后可以使用数据结构在给定的时间间隔内搜索已知基因:

>> result = knownGene[b'chr1'].search(100000, 138529)

除了knownGene之外,还可以加载其他ucsc表,或者指定要从中读取表的自定义url或文件。 有关详细信息,请参阅GenomeIntervalTree.from_table方法的docstring。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
安卓在java中加入字符串组以创建复合字符串   java系统甚至不点击“下一步”或“上一步”按钮就将我返回到上一页,而不是进入下一页   java如何在arrayList中获取特定列的不同值   CXF GZIP REST JAVA   Java:使用大量半恒定标志检查优化循环中的循环?   java如何在两个应用程序之间进行会话管理?   java SVG文件使用蜡染(但没有轴线)转换为PNG   使用协议缓冲区和内部数据模型的java   java如何在logtag 安卓中打印和查看字符串的值   javascript如何在NodeJs中应用Java/Spring的分层架构?   java Spring URL在JSP中编码不正确   模式对话框后面的java工具提示   java WSRPC生成日历对象而不是日期   在对象外部无法识别类变量   java将图像从文件读/写到BuffereImage的最快方法?   JavaSpring数据存储库对具有不同Id的子类使用抽象超类   安全在Java 5.0上运行web应用程序服务器有危险吗?