与ensembl参考基因组元数据的python接口

pyensembl的Python项目详细描述

Pyensembl

pyensembl是一个python接口，用于引用基因组元数据，如外显子和转录本。pyensembl从ensembl ftp服务器下载gtf和fasta文件并将其加载到本地数据库中。Pyensembl还可以使用用户提供的GTF和FASTA文件指定的自定义参考数据。

示例用法

frompyensemblimportEnsemblRelease# release 77 uses human reference genome GRCh38data=EnsemblRelease(77)# will return ['HLA-A']gene_names=data.gene_names_at_locus(contig=6,position=29945884)# get all exons associated with HLA-Aexon_ids=data.exon_ids_of_gene_name('HLA-A')

安装

您可以使用pip安装pyensembl

pip install pyensembl

这也应该安装任何必需的软件包，例如datacache biopython

在使用pyensembl之前，运行以下命令下载并安装 ENSEMBL数据：

pyensembl install --release <list of Ensembl release numbers> --species <species-name>

例如，pyensembl install--release 7576--species human将下载并安装所有来自ENSEMBL的人体参考数据发布75和76。

或者，可以从python内部创建ensemblelease对象处理并调用ensembl_object.download（）然后调用ensembl_object.index（）

缓存位置

默认情况下，pyensembl使用特定于平台的cache文件夹并将文件缓存到pyensembl子目录中。您可以通过设置环境键pyensembl_cache_dir来覆盖此默认值作为您的首选缓存位置：

exportPYENSEMBL_CACHE_DIR=/custom/cache/dir

或

importosos.environ['PYENSEMBL_CACHE_DIR']='/custom/cache/dir'# ... PyEnsembl API usage

`非集成数据`

Pyensembl还允许通过规范任意基因组到ensembl和非ensembl gtf的本地文件路径或远程url的和fasta文件。（警告：GTF格式可能不同，并且处理非ENSEMBL数据仍在开发中。）

例如：

data=Genome(reference_name='GRCh38',annotation_name='my_genome_features',gtf_path_or_url='/My/local/gtf/path_to_my_genome_features.gtf')# parse GTF and construct database of genomic featuresdata.index()gene_names=data.gene_names_at_locus(contig=6,position=29945884)

`API`

ensemblelease对象有方法允许您访问所有可能的注释特征的组合基因名，基因id，转录名，转录ID，外显子ID以及这些基因组元素（续，起始位置，终止位置，链）。

`基因`

< DL>基因（contig=none，strand=none）
返回基因对象的列表，可选地限制为特定的contig
或钢绞线。
位于u位点的基因（contig，position，end=none，strand=none）
返回一个与contig上的特定位置重叠的基因对象列表，
（可选）使用end参数扩展到一个范围并限制为
向前或向后的钢绞线，通过传递钢绞线="+"或钢绞线="-"。
按ID排序的基因（Gene ID）
返回给定ENSEMBL基因ID的基因对象（例如"ensg0000068793"）。
基因名（contig=none，strand=none）
全部返回注释数据库中的基因名，可选限制
到一个特定的容器或钢绞线。
基因按名称（基因名称）
获取具有给定名称的所有unqiue基因（可能有多个
由于基因组中有拷贝），返回包含每个
不同的ID。
基因与蛋白质（蛋白质）
找到与给定的ensembl蛋白id相关的基因（例如"ensp0000350283"）
基因名在基因座（contig，position，end=none，strand=none）
与给定位点重叠的基因的名称，可选地受链限制。
（返回一个列表以说明重叠的基因）
基因ID的基因名称（基因ID）
返回具有给定genen id的基因的名称。
转录本id（转录本id）的基因名
返回与给定转录本id相关的基因的名称。
基因名（转录名）
返回与给定转录本名称相关的基因的名称。
外显子id（外显子id）的基因名
返回与给定外显子id相关的基因的名称。
基因（contig=无，strand=无）
返回注释数据库中的所有基因ID，可选地受
染色体名称或链。
基因名称的基因ID（基因名称）
返回具有给定名称的所有Ensembl基因ID。
成绩单
< DL>转录本（contig=none，strand=none）
返回
Ensembl数据库，可选地限制在特定的contig或strand。
按ID转录（转录ID）
为给定的ensembl转录id（例如"enst0000369985"）构造一个转录对象
按姓名抄写（抄写姓名）
返回与给定名称匹配的每个转录的转录对象列表。
转录名称（contig=none，strand=none）
返回注释数据库中的所有转录本名称。
转录ID（contig=none，strand=none）
返回注释数据库中的所有转录ID。
基因id（gene id）的转录id
返回与给定基因id相关的所有转录本的id。
基因名（基因名）的转录ID
返回与给定基因名相关的所有转录本的ID。
转录名称（转录名称）
查找具有给定名称的所有Ensembl转录ID。
外显子id的转录本id（外显子id）
返回与给定外显子id相关联的所有转录本的id。
外显子
< DL>外显子id（contig=none，strand=none）
返回注释数据库中的外显子id列表，可以选择受限制
通过给定的染色体和链。
基因id的外显子id（基因id）
返回与给定基因id相关联的外显子id列表。
基因名的外显子id（基因名）
返回与给定基因名相关联的外显子ID列表。
转录id的外显子id（转录id）
返回与给定转录ID相关联的外显子ID列表。
转录名的外显子id（转录名）
返回与给定转录本名称相关联的外显子ID列表。
标签：
数据
名称
none
id
基因组
基因
contig
ensembl
外显子
pyensembl
欢迎加入QQ群-->： 979659372
                                    
推荐PyPI第三方库
test-pkg-evinlort
小测试包
sftpman
一个命令行应用程序，帮助您装载sftp文件系统。
dga
一种简单的离散遗传算法。
engineering-tool
这个工程工具库
ToscaWidgets
基于turbogears小部件的web小部件创建工具包
django-simplemenu-simplified
Django的简单菜单
mrcrypt
可以使用AWS加密SDK对多个AWS KMS区域中使用的加密/解密秘密的命令行工具。
dynamodb-json
dynamodb json util from和to python对象
django-bittersweet
从django sugar中选择django实用程序
slvcodec
用于生成vhdl以转换为std_逻辑向量和从std_逻辑向量转换为std_逻辑向量的实用程序，以及用于创建python描述的测试台的实用程序。
game-starter
决定何时开始游戏，取决于谁拿着按钮。
tensorflow-estimator
张量流估计器。
django-gpxp
gpxpy的django集成
check-tier
Django应用程序在部署前检查层。
stringutils
python的函数字符串实用程序库

导 航 栏

                                            项目 描述
                                        

                                            版本历史
                                        

                                                下载文件
                                            
项目 链接
首页
                                    
标 签
许可证: BSD许可证（BSD 3条款）
作者信息:: 暂无
                                
                            
维护者

                                  openvax
                                
                                  tavinathanson
                                
                                  hammerlab
                                
                                  timodonnell
                                
                                  iskander
                                
最新PyPI项目
italian_vip_says
UFx
vofs
fake_item_generator
NerEva
django-monologue
fio_product_attribute_strict
climailsystem
pyshape
tbb-devel
npy-append-arra
anthill.tal.macrorenderer
odoo11-addon-stock-a
uuuu
contextil
fyl_nester
appomatic_renderable
teacher
chuletas
slackbot_ce
最新Python常见问题
我是否正确构建了这个递归神经网络
我是否正确理解acquire和realease是如何在python库“线程化”中工作的
我是否正确理解Keras中的批次大小？
我是否正确理解PyTorch的加法和乘法？
我是否正确组织了我的Django应用程序？
我是否正确计算执行时间？如果是这样，那么并行处理将花费更长的时间。这看起来很奇怪
我是否每次创建新项目时都必须在PyCharm中安装numpy？（安装而不是导入）
我是否每次运行jupyter笔记本时都必须重新启动内核？
我是否用python安装了socks模块？
我是否真的需要知道超过一种语言，如果我想要制作网页应用程序？
我是否缺少spaCy柠檬化中的预处理功能？
我是否缺少给定状态下操作的检查？
我是否能够使用函数“count（）”来查找密码中大写字母的数量(（Python）
我是否能够使用用户输入作为colorama模块中的颜色？
我是否能够创建一个能够添加新Django.contrib.auth公司没有登录到管理面板的用户？

pyensembl 1.7.5

pyensembl的Python项目详细描述

Pyensembl

示例用法

安装

缓存位置

`非集成数据`

`API`

`基因`

成绩单

外显子

推荐PyPI第三方库

test-pkg-evinlort

sftpman

dga

engineering-tool

ToscaWidgets

django-simplemenu-simplified

mrcrypt

dynamodb-json

django-bittersweet

slvcodec

game-starter

tensorflow-estimator

django-gpxp

check-tier

stringutils

导航栏

项目链接

标签

维护者

最新PyPI项目

最新Python常见问题

pyensembl 1.7.5

pyensembl的Python项目详细描述

Pyensembl

示例用法

安装

缓存位置

非集成数据

API

基因

成绩单

外显子

推荐PyPI第三方库

test-pkg-evinlort

sftpman

dga

engineering-tool

ToscaWidgets

django-simplemenu-simplified

mrcrypt

dynamodb-json

django-bittersweet

slvcodec

game-starter

tensorflow-estimator

django-gpxp

check-tier

stringutils

导 航 栏

项目 链接

标 签

维护者

最新PyPI项目

最新Python常见问题

`非集成数据`

`API`

`基因`

导航栏

项目链接

标签