存储和访问基因表达数据集和基因定义。

genedataset的Python项目详细描述


genedataset是存储和访问基因表达式的包 数据集和基因定义。它包含两个主要类,geneset 和数据集。

基因集

geneset存储来自ensembl和 ncbi/entrez(仅限鼠标和人),以便您可以查询:

$ gs = geneset.Geneset().subset(queryStrings='ccr3')
$ print gs.geneIds()
 ['ENSG00000183625', 'ENSMUSG00000035448']
$ gs.dataframe()
 | EnsemblId          | Species     | EntrezId | GeneSymbol | Synonyms                     | Description                      | MedianTranscriptLength | Orthologue              | ExonLength |
 |--------------------|-------------|----------|------------|------------------------------|----------------------------------|------------------------|-------------------------|------------|
 | ENSG00000183625    | HomoSapiens | 1232     | CCR3       | CC-CKR-3|CD193|CKR3|CMKBR3   | chemokine (C-C motif),receptor 3 | 1242.5                 | ENSMUSG00000035448:Ccr3 | 3568.0     |
 | ENSMUSG00000035448 | MusMusculus | 12771    | Ccr3       | CC-CKR3|CKR3|Cmkbr1l2|Cmkbr3 | chemokine (C-C motif),receptor 3 | 3273                   | ENSG00000183625:CCR3    | 3273.0     |

数据集

数据集可以存储基因表达数据以便查询。这个 存储的数据包括表达值(微阵列和rna序列)和 样本数据打包成HDF5格式。

$ ds = dataset.Dataset("genedataset/data/testdataset.h5")
$ ds
 <Dataset name:testdata species:MusMusculus, platform_type:microarray>
$ ds.expressionMatrix()
 | probeId | s01  | s02  | s03  | s04  |
 |---------|------|------|------|------|
 | probe1  | 3.45 | 4.65 | 2.65 | 8.23 |
 | probe2  | 5.54 | 0.00 | 1.43 | 6.43 |
 | probe3  | 0.00 | 0.00 | 4.34 | 5.44 |
$ ds.sampleTable()
 | sampleId | celltype | tissue |
 |----------|----------|--------|
 | s01      | B1       | BM     |
 | s02      | B1       | BM     |
 | s03      | B2       | BM     |
 | s04      | B2       | BM     |

联系人

jarny choi

更改

  • v0.1.x-初始版本,对测试pypi和github上传/下载进行了一些小的调整。
  • v0.6.2-在数据中添加了一个新列“exonlength”。

许可证

MIT License

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java在TextView中对齐部分文本   带有iText和eTPKCS11的java PKCS#11签名。dll&SunPKCS11提供程序   java Intellij Idea找不到jar   java Chrome/Firefox和Jetty HTTPS   java我无法打包找不到的JavaFX应用程序模块   多线程Java:排序从异步任务检索的结果   java客户端/服务器socket不能与外部连接一起工作   java如何在单击“下一步”按钮时获取其他详细信息?   java组织。springframework。网状物客户RestTemplate应声明为@Bean,而plain@Autowired抛出错误   java如何绘制javax。摆动将ImageIcon转换为JavaFX。fxml呈现用户界面?   使用for循环的Java跟踪   java如何编码字符串以显示彩色文本(基于字符串中的前缀)   Java保存/打开文件对象   基于java复选框的搜索:使用尽可能多的“”动态生成准备好的语句作为选中复选框的计数   java为什么crawler4j随机挂起?