与斯坦福基因组测序服务中心(gssc)合作的实用程序dnanexus的应用逻辑。
scgpm-seqresults-dnanexus的Python项目详细描述
Seqcenter_dnanexus
在dnanexus上使用scgpm排序中心应用程序逻辑的实用程序
api文档在Read the Docs上。
提供用于处理存储在dnanexus项目中的排序结果的高级方法和脚本。这个存储库面向斯坦福基因组测序中心在dnanexus中创建的测序结果项目,因为有许多项目属性是其工作流独有的,在这里可以使用和查询。
这个api的核心在于DxSeqResults()
模块中的dnanexus_utils.py
类。给定感兴趣的dnanexus项目,用户可以使用该项目周围的高级方法来执行以下操作:
- 下载一个或多个条形码示例的质量控制报告和JSON统计信息,
- 下载fastq文件或将其作为dnanexus dxfile对象获取,
- 检索在特定fastq文件上设置的属性,
- 接受DNanexus中的项目转移,
- 还有更多。
脚本有很多,其中包括以下工具:
- 清理项目以节省空间,
- 列出向特定组织计费的项目及其属性,
- 下载感兴趣的FastQ,
- 向项目添加属性,
- 接受项目转让
上面的第一点已经被大量用于节省空间和成本。该脚本名为scgpm_clean_raw_data.py
,通过删除项目原始数据文件夹中不必要的附加文件来工作。它的工作原理是在dnanexus上运行一个同名的应用程序,并清除过去n天内创建的所有项目。