使用python或pandas合并多个文件

File1 ID Type Condition Colour 113884 M Good Green 123456 M Good Blue 178101 U Good Yellow 245645 U Good Red 256178 X Fair Green 803989 X Poor Red File2 ID Type Condition Colour 113884 M Good Green 123456 M Good Blue 172221 M Poor Red 178101 U Good Yellow 256178 X Fair Green File 3 ID Type Condition Colour 113884 M Good Green 123456 M Good Blue 172221 M Poor Red 178101 U Good Yellow 178101 U Good Yellow 256178 X Fair Green 286762 Q Good Purple

import os, glob all_line =[] for file in golob.glob('*.txt'): infile = open('file', 'r') for line in file: line=line.strip.split('\t') if line[1]=='M' or line[1]=='Q': all_line.append(line)

1条回答

网友

1楼 · 发布于 2024-06-06 19:42:43

你可以这样做：

import os
import glob
import pandas as pd

files = glob.glob(r'D:\temp\.data\File*.csv')

def merge_files(files, **kwargs):
    dfs = []
    for f in files:
        dfs.append(
            pd.read_csv(f, delim_whitespace=True, usecols=['ID','Type'])
              .query("Type in ['M','Q']")
              .drop_duplicates()
              .assign(col=0)
              .rename(columns={'col':os.path.splitext(os.path.basename(f))[0]})
              .set_index(['ID','Type'])
        )
    return pd.concat(dfs, axis=1).notnull()


result = merge_files(files).reset_index()
print(result)

输出：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章