如何在Python中将二进制文件读取为十六进制?我想读取一个十六进制格式的数据文件: 01ff0aa121221aff110120...etc 这些文件包含100.000个这样的字节,有些超过了1000.000(它们来自DNA测序) 我尝试了以下 ...2024-05-13 已阅读: n次
如何使模拟更快?我正在做一个python模拟,用于亲属关系分析。输入是EIGENSTRAT.geno文件,包含0和2个数字,每个样本120万个。我想模拟“坏”位置,所以随机(根据一个变量)将位置设置为9,这就是eig ...2024-05-13 已阅读: n次
Linux将长格式转换为宽格式我想使用awk语句或Python从长格式转换文件。你知道吗 我的输入文件如下所示 ID Chr_Position Geno 111 1_1234 0 111 1_12345 1 111 1_2345 ...2024-05-13 已阅读: n次
如何将没有分隔符的矩阵导入python?我有一个.geno文件,基本上是一个有0-1-2-9个数字的矩阵。我尝试将其导入python进行进一步分析。看起来是这样的: 0 101011101101102000111111101001 ...2024-05-13 已阅读: n次
Python中的Replace函数不起作用(其他答案没有解决我的问题)我知道这是一个重复的问题,但我尝试了其他问题的答案,我无法解决这个问题 总之,我想用“A”替换0,用“A B”替换1,用“B B”替换2,用“0”替换5 我的插补数据文件(datafile.txt)格 ...2024-05-13 已阅读: n次
python删除lis中字符串中的所有非数字字符我有一份清单: my_list = ['Judy 88 5', 'animal 91 5', 'Mo 86 5', 'Geno 87 6', 'exhaled 87 6'] 我要从列表中删除所有非数 ...2024-05-13 已阅读: n次
3D tsne的特定标记我一直在尝试将尽可能多的信息塞进一个3D t-SNE图形中。因此,我想为不同的点添加颜色,并使不同的点具有不同的形状(基因型由颜色分隔为0、1或2,试管类型由不同的数字/标记分隔为1或0) 这是我尝试 ...2024-05-13 已阅读: n次
基于Numpy的大规模矩阵乘法我面临一个问题,我需要在两个大矩阵A [400000 x 70000]和B [70000 x 1000]之间执行矩阵乘法。这两个矩阵是稠密的,没有我可以利用的特殊结构。在 目前我的实现是将A分成多个行 ...2024-05-13 已阅读: n次
IOError:无法读取数据(无法打开目录)缺少gzip压缩fi我以前从未使用过HDF5文件,为了开始使用,我收到了一些示例文件。我用h5py检查了所有的基础知识,查看了这些文件中的不同组,它们的名称、键、值等等。一切正常,直到我想查看保存在组中的数据集。我得到了 ...2024-05-13 已阅读: n次
numpy:从屏蔽记录查询数据?我有这样的面具唱片 In [41]: x Out[41]: masked_records( CHR : [12 12 12 ..., 12 12 12] SNP : [rs4 ...2024-05-13 已阅读: n次
Seaborn lineplot使用一个用于着色的分组变量分别绘制所有条目(线)我试图通过使用一个用于图例目的的变量来绘制数据帧中的所有条目。我的数据框看起来像: 如果我尝试通过sns.lineplot和hue='Punto'进行绘图,它将聚合所有条目 ax = sns.lin ...2024-05-13 已阅读: n次
如何使这种转换更有效?我正在开发一个python vcf到EIGENSTRAT格式的转换器。我有一个代码,它工作得很好,但是它非常慢,所以我不能在项目中真正使用它。我从vcf.gz读取基因型数据,并使用此代码将其转换为.g ...2024-05-13 已阅读: n次
genomlGenoml核心 genoml是一种用于基因组学的自动机器学习(automl)。这是Genoml的核心包。 请注意,此回购协议正在为“功能测试”开发中。这不是最终产品,只是软件逻辑的初步评估。 包装网 ...2024-05-13 已阅读: n次
geno-sugar基因糖 实用程序的功能是读取bed和bgen文件并促进全基因组分析。 虽然这个模块可以用作独立模块,但它被设计为LIMIX2的构建块。limix2是一个python模块,它为遗传研究提供了大量工具, ...2024-05-13 已阅读: n次