我有两个文件矩阵,看起来像这样
文件1:
{'key1',g,l,i,o,+: [0.0, 0.0, 0.92, 0.02, 0.01],'key2',g,l,i,o,+: [0.1, 0.2, 0.90,
0.26, 0.10].....'key100',g,l,i,o,+: [0.1, 0.1, 0.29, 0.19, 0.20]}
文件2:
{'key1',g,l,i,o,+: [0.0, 0.0, 0.96, 0.06, 0.01],'key2',g,l,i,o,+: [0.0, 0.1, 0.95,
0.26, 0.11].....'key100',g,l,i,o,+: [0.2, 0.0, 0.23, 0.16, 0.21]}
两个文件都有相同的“密钥”。我想平均两个文件之间的值,因此结果文件如下所示:
所需的输出文件:
{'key1',g,l,i,o,+: [0.0, 0.0, 0.94, 0.04, 0.01],'key2',g,l,i,o,+: [0.05, 0.15, 0.925,
0.26, 0.105].....'key100',g,l,i,o,+: [0.15, 0.1, 0.29, 0.175, 0.205]}
我曾经考虑过我可以编写的python脚本,但由于我对这一点非常陌生,因此欢迎您提出任何快速的想法:
import gzip
import numpy as np
inFile1 = gzip.open('/home/file1')
inFile2 = gzip.open('/home/file2')
inFile.next()
for line in inFile:
cols = line.strip().split('\t')
data = cols[6:]
for line in inFile2:
cols = line.strip().split('\t')
data2 = cols[6:]
newdata = (data + data2)/2
可以使用regex替换字符串并使其与JSON兼容。然后您可以轻松地将其转换为dict,然后只需使用普通python分析数据(比较dict):
问题在于数据格式,正如沃丁所说:
我试过用你的数据,你可以从以下代码中得到提示和帮助:
我试过了
文件1.txt
文件2.txt:
代码:
相关问题 更多 >
编程相关推荐