如何仅在使用Python找到特定模式后才能读取csv文件？

table_doi: 10.17182/hepdata.52402.v1/t7 name: Table 7 ... ABS(YRAP), < 0.1 SQRT(S) [GeV], 1960 PT [GEV], PT [GEV] LOW, PT [GEV] HIGH, D2(SIG)/DYRAP/DPT [NB/GEV] 67, 62, 72, 6.68 ... 613.5, 527, 700, 1.81E-07

import os import glob import csv def read_multicolumn_csv_files_into_dictionary(folderpath, dictionary): filepath = folderpath + '*.csv' files = sorted(glob.glob(filepath)) for file in files: data_set = file.replace(folderpath, '').replace('.csv', '') dictionary[data_set] = {} with open(file, 'r') as data_file: data_pipe = csv.DictReader(data_file) dictionary[data_set]['pt'] = [] dictionary[data_set]['sigma'] = [] for row in data_pipe: dictionary[data_set]['pt'].append(float(row['PT [GEV]'])) dictionary[data_set]['sigma'].append(float(row['D2(SIG)/DYRAP/DPT [NB/GEV]'])) return dictionary

3条回答

网友

1楼 · 编辑于 2024-05-12 15:07:20

签出startswith。此外，您可以在这里找到详细的解释https://cmdlinetips.com/2018/01/3-ways-to-read-a-file-and-skip-initial-comments-in-python/

网友

2楼 · 编辑于 2024-05-12 15:07:20

您可以使用file.tell方法在读取和跳过行时保存文件指针位置，直到找到标题行，此时您可以使用file.seek方法将文件指针重置回标题行的开头，以便csv.DictReader可以将文件的其余部分解析为有效的CSV：

with open(file, 'r') as data_file:
    while True:
        position = data_file.tell()
        line = next(data_file)
        if line.count(',') == 3: # or whatever condition your header line satisfies
            data_file.seek(position) # reset file pointer to the beginning of the header line
            break
    data_pipe = csv.DictReader(data_file)
    ...

网友

3楼 · 编辑于 2024-05-12 15:07:20

假设每个文件都有一行以PT [GEV]开头：

import os
import pandas as pd

...
csvs = []
for file in files:
    with open(file) as f:
        for i, l in enumerate(f):
            if l.startswith('PT [GEV]'):
                csvs.append(pd.read_csv(file, skiprows = i))
                break
df = pd.concat(csvs)

相关问题更多 >

编程相关推荐

热门问题

热门文章