转换为二进制文件时发生Plink错误:.ped文件的第1行的标记比预期的少

2024-05-18 23:26:12 发布

您现在位置:Python中文网/ 问答频道 /正文

我能在这里得到帮助吗?在plink(全基因组关联分析工具集)从“ped”、“map”格式转换为二进制对应的“bed”、“bim”、“fam”时,有人遇到过以下错误吗?我使用的是Linux和plinkv1.90b3j

Error: Line 1 of .ped file has fewer tokens than expected.

我在python脚本中使用这个命令在几十个文件中运行它:

plink --file S205 --out S205 --make-bed

对于32个文件中的2个,在本例中,我得到了这个错误。该文件与所有其他文件完全相同,因为它们都是以前用同一脚本完成的。所有样本的家庭、父亲、母亲身份证和性别都是相同的,正如我所说,等位基因信息的书写方式与其他30个工作文件完全相同。在

我注意到,当我将行尾编码改为“Windows”时,错误变为以下内容。其他好的文件适用于任何类型的行尾(Unix、Win、Mac)。在

^{pr2}$

作为一个例子,我将工作*.ped(S209)和非工作(S204)的第一列和最后一列保留在这里。在

S209 S209 0 0 1 1 C C C C T T T T ... G G G G G G 

S204 S204 0 0 1 1 T T T T G G G G ... G G G G C C 

谢谢! 丹尼尔


Tags: 文件脚本map基因组格式错误file工具集
1条回答
网友
1楼 · 发布于 2024-05-18 23:26:12

我发现了问题。我的“ped”文件与“map”文件的基因型数目不完全相同,因为基数低。我的脚本跳过那些snp,不向ped输出任何东西。由于“map”文件是基于GATK堆积文件位置创建的,因此存在不匹配,因为所有位置都被转移到“map”文件中。也许把这个放在这里是有用的,但它可以标记为已解决。在

相关问题 更多 >

    热门问题