Snakemake只传递输出到shell命令中的第一个路径

2024-06-01 05:32:06 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图将所有路径同时输入到snakemake中的python脚本中,如下所示:

rule neo4j:
  input:
      script = 'python/neo4j.py',
      path_to_cl = 'results/clusters/umap/{sample}_umap_clusters.csv',
      path_to_umap = 'results/umap/{sample}_umap.csv',
      path_to_mtx = 'data_files/normalized/{sample}.csv'
  output: 'results/neo4j/{sample}/cells.csv', 'results/neo4j/{sample}/genes.csv', 
      'results/neo4j/{sample}/cl_nodes.csv', 'results/neo4j/{sample}/cl_contains.csv',
      'results/neo4j/{sample}/cl_isin.csv', 'results/neo4j/{sample}/expr_by.csv',
      'results/neo4j/{sample}/expr_ess.csv'
  shell:
      "python {input.script} -path_to_cl {input.path_to_cl} -path_to_umap {input.path_to_umap} -path_to_mtx {input.path_to_mtx} -output {output}"

当我访问python脚本中的output参数时,它只看到第一个路径:'results/neo4j/{sample}/cells.csv'。我也尝试过命名每一条路径,但它没有解决问题。如何将规则的output中的所有路径作为数组或字典传递,以便以后在python中访问它们?在


Tags: csvtosamplepath路径脚本inputoutput
2条回答

如果我正确地理解了您的问题,您的问题是neo4j.py脚本的-output参数不接受多个文件:shell命令可能以文件的完整列表结尾(请检查-p选项的snakemake),但是脚本只考虑第一个文件。在

如果确实是这样的话,一种可能更简洁的方法是修改neo4j.py脚本的接口,使其对每个输出文件使用一个参数。在

然后按如下方式修改规则:

rule neo4j:
    input:
        script = 'python/neo4j.py',
        path_to_cl = 'results/clusters/umap/{sample}_umap_clusters.csv',
        path_to_umap = 'results/umap/{sample}_umap.csv',
        path_to_mtx = 'data_files/normalized/{sample}.csv'
    output:
        cells = 'results/neo4j/{sample}/cells.csv',
        genes = 'results/neo4j/{sample}/genes.csv',
        nodes = 'results/neo4j/{sample}/cl_nodes.csv',
        contains = 'results/neo4j/{sample}/cl_contains.csv',
        isin = 'results/neo4j/{sample}/cl_isin.csv',
        by = 'results/neo4j/{sample}/expr_by.csv',
        ess = 'results/neo4j/{sample}/expr_ess.csv'
    shell:
        """
        python {input.script} \\
             path_to_cl {input.path_to_cl} \\
             path_to_umap {input.path_to_umap} \\
             path_to_mtx {input.path_to_mtx} \\
             cells {output.cells} \\
             genes {output.genes} \\
             nodes {output.nodes} \\
             contains {output.contains} \\
             isin {output.isin} \\
             by {output.by} \\
             ess {output.ess}
        """

一些可能有用的python模块可用于设置脚本的接口:


编辑

如果您不想将每个输入文件作为一个单独的参数传递,您可以简单地传递输出目录,并让您的脚本从这个参数构建输出路径。给定所需的文件名,这似乎是可能的:

^{pr2}$
rule hello:
    output:
        "woot", "hoot"
    run:
        for f in output:
            print(f)
        print(output[1])

打印“woot”,“hoot”,“hoot”。在

相关问题 更多 >