分割一个fasta文件并基于第一个lin重命名我有一个包含以下内容的大文件: 文件名:input.txt >chr1 jdlfnhl dh,ndh dnh. dhjl >chr2 dhfl dhl dh;l >chr3 ...2024-04-29 已阅读: n次
列表列表的Python字母数字排序 我正在尝试对表单列表进行排序: [["Chr1", "949699", "949700"],["Chr11", "3219", "444949"], ["Chr10", "699", "800"], ...2024-04-29 已阅读: n次
在python中为散乱的d选择特定列我有一个空间隔离的文件,我必须从中获取特定列的数据。我的文件如下所示: chr1.trna124 (75052562-75052633) Length: 72 bp Type: His ...2024-04-29 已阅读: n次
读取pandas中不带标题的制表符分隔的数据我在使用pandas打开不带标题的制表符分隔的数据时遇到问题。 我的测试数据(实际上包含200行,我显示的是前10行): Tag19184 CTAAC hffef 1 a 36 ...2024-04-29 已阅读: n次
如何使用其他列按条件按行提取数据帧值?我有一个数据框,如下所示: #values a=["003C", "003P1", "003P1", "003P1", "004C", "004P1", "004P2", "003C", "003P2 ...2024-04-29 已阅读: n次
比较数组:根据坐标对TSV文件中的行进行分组我正在尝试使用python2.7.2对包含制表符分隔值列表的文件执行一些操作。有关更多信息,文件格式称为BED,表示一个基因列表,其中每个基因用一行表示。每行的前三个字段表示坐标。另一个字段包含的描述 ...2024-04-29 已阅读: n次
用a+B列中的字符替换[C]中的字符的最佳方法是什么我用熊猫和我得到堆栈在下面的任务。你知道吗 我有下表: CHROM POS SNP chr1 931131 ? chr1 959265 ? chr1 970922 ...2024-04-29 已阅读: n次
计算字符串和数字与pandas匹配的行数我在SAMPLE列中有1-12个数字,对于每个数字,我尝试计算突变数(A:T,C:G等)。这段代码很好用,但是我如何修改代码,让我为每一个变异都有12个条件,而不是为每一个变异写同样的代码12次呢?在 ...2024-04-29 已阅读: n次
如何同时计算一个大文件中的词频?我需要计算一个3gbgzip压缩的英语句子纯文本文件的词频,解压缩时大约是30gb。在 我有一个带有collections.Counter和gzip.open的单线程脚本,需要几个小时才能完成。在 因 ...2024-04-29 已阅读: n次
有条件地调用R中的特定列我有一个.gz文件,其中包含一个大文本文件。结构如下所示: propVarQ,0.1 multiplier,2.0 p,1,chr1,3 p,1,locus1,80828536,35.735,0.43 ...2024-04-29 已阅读: n次
将对象与python字典/hashtab中的键进行比较也许我的标题会让人误解,但让我澄清一下我的问题: 下面是一个列表: chr1:100-200 100 100 chr1:350-500 150 250 chr1:780-880 100 350 chr ...2024-04-29 已阅读: n次
获取模式ae | ea | s3以替换python中字符串中的字符我想给出编码指令'ae | ea | s3',其中a替换为e,e替换为a,s替换为3。但我在编写程序时遇到了问题,无法插入模式chr替换为chr1 | chr2替换为chr3 | chr4替换为chr ...2024-04-29 已阅读: n次
mummer-idotplot木乃伊idotplot 使用plotly从mummer4输出生成交互式点图 安装 $ pip install mummer-idotplot plotly需要安装。 用法 将两个序列与mummer4 ...2024-04-29 已阅读: n次
ngCGH 概述 下一代肿瘤/正常对测序提供了一个很好的机会来检测肿瘤相对于正常样本的大规模拷贝数变化。实际上,这一概念似乎甚至延伸到对肿瘤和正常人的外显子捕获序列。这个库由一个单独的脚本ngcgh组成,该脚本 ...2024-04-29 已阅读: n次
chunked-scatter分块散布 此工具以bed文件或序列字典为输入,并将 把染色体连接成一定大小的重叠块。这些块会 然后放入新的床文件,每个文件一个染色体。小染色体 将被放在一起,以避免创建数千个文件。 安装 从githu ...2024-04-29 已阅读: n次
aclustaclust==具有自定义距离和相关性的流聚合群集*聚合群集*是一个非常简单的算法。这里提供的函数“aclust”是对允许输入流的修改版本的一个简单实现的尝试,这样就不需要读取数据。一下子记住了。大多 ...2024-04-29 已阅读: n次
pyBedGraphPyBedGraph 用于对一维基因组信号轨迹进行快速操作的python包。 功能 在bedGraph文件中查找给定间隔的平均值、近似平均值、最大值、最小值、覆盖率或标准偏差 部分用cython编写 ...2024-04-29 已阅读: n次
targqc[![水蟒服务器徽章](https://anaconda.org/vladsaveliev/targqc/badges/installer/conda.svg)](https://conda.anac ...2024-04-29 已阅读: n次
myvariant 简介 MyVariant.Info提供简单易用的REST web服务来查询/检索genetic 变量注释数据它的设计简单,注重性能。 myvariant是一个易于使用的python包装器,用于 ...2024-04-29 已阅读: n次
bgvep读取在bgvep项目中生成的数据。 在那个项目中有两个数据集,都由 参考基因组(如hg19)和vep版本(如88): 包含基因组中所有位置的vep运行的tabix文件 只有最严重后果类型的bgpac ...2024-04-29 已阅读: n次
pyopenpyopen是一个命令行工具,用于使用python快速检查文件。它将您放入一个交互式的ipython会话中,并将解析后的文件作为本地变量提供。 目前支持csv/tsv文件(使用panda,还支持gzi ...2024-04-29 已阅读: n次
CoverageCompacter覆盖压实机 下一代测序(ngs)是一个昂贵的过程,但如果只有高质量的库,它的成本可能会大大降低 进行了测序。coveragecompacter可用于生成对 如果这些库要进行进一步测序,则在超低深度测序 ...2024-04-29 已阅读: n次