我有80个表格格式的文本文件(列和行)。每个文件都有一个ID列,其中一些可能是相同的。我想简单地写一个新文件,这个文件应该有一个由id列组成的头,然后是1到80列,其中每列代表将从每个文件中获取的一些数据。读取每个文件后,它将获取其id并将其放置在新的“文件id”列中,然后从每个文件中获取5列x4行(20个单元格),然后将其放置在属于“文件标记”列的列中。对于files标记的其余列,将使用NA,类似于以下内容:
1cvs id仅存在于文件1中。列1第x12行的单元格应具有 5列X4行。 收割台
输入文件如下所示: 例如,文件1看起来像:
id readsfw readsrv .......
1cvs 1 3
2jsh 4 6
输出文件如下所示:
id 1 2 3 4 5 6 7 8 .....
1cvs NA NA NA NA NA NA NA ..
2jsh
shd
.
.
我读取多个文件的方法如下:
def Read(pathname):
with open(pathname,'r') as f:
reader=csv.reader((f),delimiter='\t')
for i,row in enumerate(reader):
# How to work the code to do the writing as described above
try:
folder_input = raw_input()
except Name_Error:
pass
for root,dirs,files in os.walk(folder_input):
for file in files:
if file.endswith(".tsv"):
pathname=os.path.join(root,file)
Read(pathname)
如何使用python实现这一点?你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐