Python从.csv读取数据并将其分配给预定义的变量

import re import csv #Call for the export file data = open('C:/Exports/Export 3.csv') #Make a list with the predefined variables definition = ["record_id", "abbreviation", "study_id", "step_count", "distance", "ambulation_time", "velocity", "cadence", "norm_velocity", "step_time_differential", "step_length_differential", "cycle_time_differential", "step_time", "step_length", "step_extremity", "cycle_time", "stride_length", "hh_base_support", "swing_time", "stance_time", "single_support_time", "double_support_time", "toe_in_out"] my_data = {} #Show data for each row without whitespace for line in data: line = line.rstrip() #print(line) values = re.findall("-?[0-9].+", line) print(values)

2条回答

网友

1楼 · 编辑于 2024-04-26 17:46:13

差不多完美了！好像有点小问题。在结果.csv我缺少以下变量的值：

step_time
step_length
cycle_time  
stride_length   
hh_base_support 
swing_time  
stance_time 
single_supp_time    
double_supp_time    
toe_in_out

我用代码的这一部分来检查结果：

^{pr2}$

这给了我以下信息：

stepcount stepcount 3  
distance distance 292,34  
ambulationtime ambulationtime 1,67  
velocity velocity 175,1  
cadence cadence 107,8  
velocity normalizedvelocity ,  
normalizedvelocity normalizedvelocity ,  
steptimedifferential steptimedifferential 0,004  
steptime steptimedifferential 0,004  
steplengthdifferential steplengthdifferential 1,051  
steplength steplengthdifferential 1,051  
cycletimedifferential cycletimedifferential 0,008  
cycletime cycletimedifferential 0,008  
steptime steptime(sec) 0,558 0,554
steplength steplength(cm) 96,746 97,797
stepextremity stepextremity(ratio) , ,
cycletime cycletime(sec) 1,116 1,108
stridelength stridelength(cm) 192,159 197,122
hhbasesupport hhbasesupport(cm) 2,988 6,32
swingtime swingtime(sec) 0,466 0,466
stancetime stancetime(sec) 0,65 0,642
velocity stridevelocity 172,185 177,908
steptime steptimestddev , 0,006
stridelength stridelengthstddev , ,
swingtime swingtimestddev , ,
stancetime stancetimestddev , ,
velocity stridevelocitystddev , ,
singlesupptime singlesupptimestddev , ,
doublesupptime doublesupptimestddev , ,

从上面的输出中，您可以看到名称与多个字符串匹配时存在一些问题（如velocity），而有些根本不匹配（如toe_u in_out），我不知道如何解决这个问题。在

我还试图计算两个值的平均值，但这给了我一个错误：ValueError:无法将字符串转换为float。我认为这是逗号的原因。我尝试在for循环中应用以下代码来计算平均值：

float(row[1]+float(row[2])) / 2

网友

2楼 · 编辑于 2024-04-26 17:46:13

打开文件时，应使用csv库，semi-colon分隔开，然后将第一列与定义中的项进行比较。这几乎可以做到：

import csv
from collections import defaultdict

data = defaultdict(str)

#Make a list with the predefined variables
definition = ["record_id", "abbreviation", "study_id", "step_count",
"distance", "ambulation_time", "velocity", "cadence", "norm_velocity",
"step_time_differential", "step_length_differential",
"cycle_time_differential", "step_time", "step_length", "step_extremity",
"cycle_time", "stride_length", "hh_base_support", "swing_time",
"stance_time", "single_support_time", "double_support_time", "toe_in_out"]

with open('C:/Exports/Export 3.csv', 'r') as f, 
     open('C:/Exports/result.csv', 'w') as outfile:
    reader = csv.reader(f, delimiter=';')
    next(reader, None)  # skip the headers

    writer = csv.DictWriter(outfile, fieldnames=definition, lineterminator='\n')
    writer.writeheader()

    for row in reader:
        for item in definition:
            h = item.replace('_','')
            r0 = row[0].lower().replace(' ','')
            if h in r0:
                print(h, r0)
                data[item] = row[1] 

    data['record_id'] = 1 # record id does not exist in input file: Export 3.csv

    writer.writerow(data)

要从项目中获取平均值，可以使用：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章