用于从bgen文件加载数据的包

bgen的Python项目详细描述


另一个bgen阅读器

travis

这是一个用于读取bgen files的包。在

这个包使用cython包装用于解析bgen文件的c++代码。这是公平的 很快,它可以分析500000个个体的基因型,每种变异大约300个 在单个python进程中的第二个(每秒约4.5亿个概率 使用3GHz CPU)。降低基因型概率是一个缓慢的步骤, 使用zstd压缩基因型,zlib减压占总时间的80% 会快得多,可能快2-3倍?在

这已经为UKBiobank bgen文件(即bgen版本1.2和 zlib压缩了8位基因型概率,但是其他bgen版本和 zstd压缩也已经用bgen文件进行了测试)。在

安装

pip install bgen

用法

frombgenimportBgenFilebfile=BgenFile(BGEN_PATH)rsids=bfile.rsids()# select a variant by indexingvar=bfile[1000]# pull out genotype probabilitiesprobs=var.probabilities# returns 2D numpy arraydosage=var.minor_allele_dosage# returns 1D numpy array for biallelic variant# iterate through every variant in the filewithBgenFile(BGEN_PATH,delay_parsing=True)asbfile:forvarinbfile:dosage=var.minor_allele_dosage# get all variants in a genomic regionvariants=bfile.fetch('21',10000,5000000)
API文档 ^{pr2}$

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
使用jaxrpc的Java eclipse WebService客户端   java编程方式在对象上写入名称   java Spring批处理:重试后跳过   java Android错误:错误:任务执行失败:应用程序:transformClassesWithDexForDebug'   带有清单文件nullPointerException的java Android元数据   spring Java Quartz调度作业停止运行   JavaMockito:如何在不调用实际方法的情况下,模拟带有参数和无效返回类型的静态方法?   java Tomcat连接池问题无法在关闭的连接上调用方法   java如何交换列表中的项目?   java如何停止线程并通过Toast在线程中正确显示文本?   java为什么连续写入OutputStream时偏移量0不会导致重复字节?   java我无法生成头文件   不兼容的返回类型错误java   修改值后键值对的java Jolt转换规范   java有自动更新Javadoc的工具吗?   java线程如何在ints自身实例类中共享变量   java继承一个非gwt模块   java Hibernate xml配置   使用netty4异步调用的java链接HTTP请求响应